JP7067546B2 - データ構造化装置、データ構造化方法およびプログラム - Google Patents

データ構造化装置、データ構造化方法およびプログラム Download PDF

Info

Publication number
JP7067546B2
JP7067546B2 JP2019507626A JP2019507626A JP7067546B2 JP 7067546 B2 JP7067546 B2 JP 7067546B2 JP 2019507626 A JP2019507626 A JP 2019507626A JP 2019507626 A JP2019507626 A JP 2019507626A JP 7067546 B2 JP7067546 B2 JP 7067546B2
Authority
JP
Japan
Prior art keywords
data
conversation
branch expression
node
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019507626A
Other languages
English (en)
Other versions
JPWO2018173943A1 (ja
Inventor
綾子 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018173943A1 publication Critical patent/JPWO2018173943A1/ja
Application granted granted Critical
Publication of JP7067546B2 publication Critical patent/JP7067546B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、会話データを木構造にモデル化する技術に関する。
会話データを構造化する手法の一例が特許文献1に表されている。すなわち、特許文献1はパーソナルサービスを支援するシステムに関し、当該特許文献1には、ユーザの問い合わせとそれに対するエージェントの回答との対話履歴を木構造にモデル化する手法が開示されている。木構造とは、グラフ構造の一種であり、複数のノード(節点)と、ノード間を接続するエッジ(枝)とにより表されるモデルである。木構造におけるノード間の関係は、木構造を家系図に見立てた用語を用いて表現される。木構造では、エッジにより接続されている2つのノードは親子関係にある。1つの親ノードは複数の子ノードを持つことはできるが、1つの子ノードは複数の親ノードを持つことはできない。会話を木構造にモデル化したものは会話木とも称される。また、全てのノードの親を辿っていくと辿り着く最上位のノードはルート(根)とも称され、子を持たない末端のノードはリーフ(葉)とも称される。
特許文献1に開示されている手法では、対話が発話単位をノードとするリスト構造にモデル化され、このリスト構造のデータがデータベースに記憶されている。そして、ノードにおける発話内容に基づいて複数のリスト構造が結合されることにより、対話が体系的な対話モデルにモデル化されている。これにより、対話を蓄積しているデータベースからユーザやエージェントが質問に対する回答を検索する際に、検索結果の冗長が防止され、ユーザやエージェントが有効に対話履歴のデータベースを利用できるとされている。
また、会話データを構造化する手法の別の一例が非特許文献1に開示されている。非特許文献1における手法では、会話履歴データが解析され、当該解析に基づいた各種ラベルが会話履歴データに付与される。各種ラベルとは、例えば、述語項の特定(Predicate Argument Annotation)、固有表現の特定(Named Entity Annotation)、談話行動タグ(Dialog Act Tag)やタスクサブタスクラベル(Task Subtask Label)などである。そして、それらラベルを利用した発話列の構文解析などにより会話がモデル化される。
さらに、会話データを構造化する手法の別の一例が非特許文献2にも開示されている。非特許文献2における手法では、PCFG(Probabilistic Context-Free Grammars)やPLCFRS(Probabilistic Linear Context-Free Rewriting Systems)などの文法を用いて解析対象のテキストが構造解析される。そして、この構造解析結果に基づいて解析対象のテキストがモデル化される。
特開2009-205552号公報
S. Bangalore et al. (AT&T), "Learning the Structure of Task-Driven Human-Human Dialogs", IEEE Transactions on Audio, Speech, and Language Processing, Vol. 16, No.7, PP.1249-1259, 2008 A. Louis and S. B. Cohen (U. Edinburgh), "Conversation Trees: A Grammar Model for Topic Structure in Forums", Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, PP. 1543-1553, 2015
上記のように、会話データをモデル化する手法は様々に提案されている。しかしながら、特許文献1等に記載されている手法では、人の手を用いずに複数の会話を1つの木構造(会話木)にモデル化することができないという問題が有る。複数の会話を1つの木構造にモデル化するとは、複数の会話を結合してモデル化することや、複数の会話中における共通の会話内容に応じた複数の応答の会話を1つの木構造にまとめることが含まれる。
すなわち、特許文献1には、2つの会話データを1つの木構造にまとめることは記載されている。しかしながら、特許文献1に示されている手法では、2つの会話データを1つの木構造にまとめるためには、人が、まとめる対象の会話の選択や結合部分を指定しなければならない。つまり、特許文献1の手法では、人による指定が無い場合には、複数の会話を1つの木構造にまとめることができない。また、非特許文献1,2には、1つの会話データを1つの木構造にモデル化する手法は示されているが、複数の会話データを1つの木構造にまとめる手法は示されていない。さらに、非特許文献1,2には、1つの会話データをモデル化した木構造は示されているが、当該非特許文献1,2における木構造では、ルートからリーフに向かって辿った場合に自然な会話の流れになっていない。これにより、会話の流れを考慮しつつ、或る発話に対して、どのような回答が有るかを検索しにくい。
本発明は上記課題を解決するために考え出された。すなわち、本発明の主な目的は、複数の会話データを人の手を用いずに1つの木構造にモデル化でき、しかも、会話の流れを考慮しつつ、指定の発話に対する回答の発話例を容易に取得可能な木構造を得る技術を提供することにある。
上記目的を達成するために、本発明のデータ構造化装置は、
会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得する取得部と、
会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化するモデル化部と
を備える。
本発明のデータ構造化方法は、
会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得し、
会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化する。
本発明のプログラム記憶媒体は、
会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得する処理と、
会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化する処理と
をコンピュータに実行させるコンピュータプログラムを記憶する。
本発明によれば、複数の会話データを人の手を用いずに1つの木構造にモデル化でき、しかも、会話の流れを考慮しつつ、指定の発話に対する回答の発話例を容易に取得可能な木構造を得ることができる。
本発明に係る第1実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。 本発明に係る第2実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。 第2実施形態のデータ構造化装置が利用する分岐表現データの具体例を表す図である。 第2実施形態において具体例を説明する際に利用する会話データの一例を表す図である。 第2実施形態において具体例を説明する際に利用する会話データの別の一例を表す図である。 第2実施形態において具体例を説明する際に利用する会話データのさらに別の一例を表す図である。 第2実施形態におけるモデル化部の動作例を表すフローチャートである。 複数の会話データがグラフ構造に変換された状態を説明する図である。 第2実施形態におけるモデル化部が分岐表現を利用して複数の会話データをまとめる動作例を説明する図である。 第2実施形態におけるモデル化部が複数の会話データを1つの木構造にまとめた具体的なモデル例が表されている。 本発明に係る第3実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。 第3実施形態のデータ構造化装置が処理に利用するマニュアルデータの一例を表す図である。 第3実施形態のデータ構造化装置が複数の会話データを1つの木構造にまとめた具体的なモデル例を表す図である。 本発明に係る第4実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。 第4実施形態において具体例を説明する際に利用する会話データの一例を表す図である。 第4実施形態において、抽出部によって会話データから抽出された分岐表現候補の具体例を表す図である。 第4実施形態において、複数の会話データが1つの木構造にまとめられた具体的なモデル例を表す図である。 本発明に係る実施形態のデータ構造化装置のハードウェア構成の一例を表す図である。
以下に、本発明に係る実施形態を図面を参照しつつ説明する。
<第1実施形態>
図1は、本発明に係る第1実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。第1実施形態のデータ構造化装置1は、取得部2と、モデル化部3とを備えている。取得部2は、分岐表現データを取得する機能を備えている。分岐表現データとは、会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を含むデータである。
第1実施形態では、会話データは、会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換される。モデル化部3は、グラフ構造の複数の会話データにおいて、取得部2により取得された分岐表現データに基づき、分岐表現を共通に含むノード同士を1ノードにまとめる処理を行い複数の会話データを1つの木構造にモデル化する機能を備えている。
第1実施形態のデータ構造化装置1は、分岐表現に着目することにより、複数の会話データを人の手を用いずに1つの木構造にまとめることができる。また、第1実施形態のデータ構造化装置1は、分岐表現に着目して複数の会話データを1つの木構造にまとめるので、当該データ構造化装置1による会話の木構造を用いて、例えば、会話中の問いや依頼に対する回答についての解析が容易となる。さらに、データ構造化装置1は、分岐表現に着目して複数の会話データを1つの木構造にまとめるので、会話の流れを保ちつつ(つまり、ルートからリーフに向かって辿った場合に会話を再現できる状態で)、複数の会話データを1つの木構造にまとめることができる。換言すれば、第1実施形態のデータ構造化装置1は、複数の会話データを人の手を用いずに1つの木構造にモデル化でき、しかも、会話の流れを考慮しつつ、指定の発話に対する回答の発話例を容易に取得可能な木構造を得ることができる。
第1実施形態のデータ構造化装置1による会話の木構造のモデルは、例えば、コンタクトセンタのオペレータの支援システムに利用されることにより、例えば、問いや依頼に対する回答の検索を容易にする。
<第2実施形態>
図2は本発明に係る第2実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。第2実施形態のデータ構造化装置20は、会話データを木構造にモデル化する装置であり、例えば、CPU(Central Processing Unit)により実現される。このデータ構造化装置20は、会話中の分岐表現に着目し、分岐表現を利用することにより複数の会話データを1つの木構造にモデル化する機能を備えている。
ここでの分岐表現とは、複数の会話において、会話の流れが分岐する分岐点となる発話に含まれる表現である。分岐表現の具体例として、例えば、質問表現が挙げられる。つまり、「当店のご利用は初めてですか?」という問いに対して、「はい、初めてです」、「いいえ、利用したことがあります」というように複数の回答(答え)があり、会話の流れが分岐すると考えられることから、上記のような質問(問い)の発話表現は分岐表現である。また、「ご注文をお願いします」という依頼に対し、「商品Aを注文します」、「商品Bを注文します」、「商品Cを注文します」というように複数の回答(答え)が想定される。このことから、そのような依頼表現も分岐表現として考えられる。このように、分岐表現には様々な表現が考えられる。
データ構造化装置20は記憶装置21と表示装置22に接続されている。表示装置22は、画面を有し、様々な情報を画面に表示する機能を備えている。
記憶装置21には、データ構造化装置20の機能を実現するコンピュータプログラム(プログラム)33が記憶されている。また、記憶装置21には、データ構造化装置20が処理に使用する分岐表現データ31が記憶されている。分岐表現データ31は、分岐表現を表すデータである。図3には、分岐表現データの一具体例が表されている。図3における分岐表現データ31は、正規表現を含む文字列のデータの態様となっている。ただし、分岐表現データ31は、正規表現を含む文字列のデータに限定されず、例えば、形態素解析結果により得られる品詞や形態素の原形を含む文字列のデータであってもよい。
さらに、記憶装置21には、会話データ32が記憶されている。会話データ32は例えばテキストデータである。図4~図6には、それぞれ、会話データ32の具体例が表されている。これら図4~図6に表される会話の具体例は、注文受付センターのオペレータ(図4~図6では、OPと記されている)とそのユーザ(図4~図6では、Uと記されている)との会話である。
データ構造化装置20は、例えばCPUが記憶装置21のプログラム33を読み込み当該プログラム33を実行することにより、次のような機能を持つことができる。すなわち、データ構造化装置20は、機能部として、取得部である表現受付部25と、前処理部26と、モデル化部27と、表示制御部28とを備えている。
表現受付部25は、記憶装置21から分岐表現データ31を読み出し、読み出した分岐表現データ31をモデル化部27に提供する機能を備えている。
前処理部26は、記憶装置21から処理対象の会話データ32を読み出し、読み出した会話データに前処理を施す機能を備えている。前処理とは、文分割、形態素解析(分かち書きや品詞ラベルの付与を含む)や、固有表現抽出や、照応解析などの予め定められた自然言語処理である。
モデル化部27は、表現受付部25から受け取った分岐表現データ31と、前処理部26により処理された会話データ32とに基づいて、複数の会話データを木構造にモデル化する機能を備えている。このモデル化部27による木構造は、会話開始をルートとし、会話終了をリーフとする構造を持つ。また、ここでは、1つの木構造にまとめられる複数の会話は、例えば、商品の注文を受け付ける注文受付センターのオペレータとそのユーザとの会話というように、同様な状況下で行われる会話を想定している。
図7はモデル化部27による処理の流れの一例を表す図である。例えば、図4に表される会話データ32と、図5に表される会話データ32とが前処理部26により処理され、当該処理による情報が付与された会話データ32がモデル化部27に提供されたとする。モデル化部27は、前処理部26を通して処理対象の複数の会話データ32を受け取ると(S101)、1発話を1ノードとし、前後する発話を親子とし、親子関係にあるノード間をエッジにより接続する。これにより、モデル化部27は、会話データ32をグラフ構造にモデル化する(S102)。この処理によるグラフ構造の一例が図8に表されている。なお、図8におけるOPはオペレータを表し、Uはユーザを表している。
その後、モデル化部27は、表現受付部25から受け取った分岐表現データ31に基づいて、分岐表現を含むノード(以下、分岐表現ノードとも記す)を特定する(S103)。そして、モデル化部27は、処理対象の複数の会話データ32の一つに注目し、会話開始(ルート)から会話終了(リーフ)に向かってノードを順に辿って行く。この際、モデル化部27は、最初の分岐表現ノードに関し、同様な分岐表現を共通に含む分岐表現ノードが他の会話データ32に有るか否かをチェックする。これにより、同様な分岐表現を含む分岐表現ノードが他の会話データ32に有る場合には、モデル化部27は、それら同様な分岐表現を共通に含む分岐表現ノード同士を1つのノードにまとめる(S104)。さらに、モデル化部27は、そのまとめた分岐表現ノードに含まれる発話中の形態素のうち、出現頻度の高い形態素を会話データ32からキーワードとして抽出し、当該キーワードを分岐表現ノードに付与する(S105)。
具体的には、例えば、図3に表される分岐表現データ「(ご)?注文.*(ですか?|お願いします。)$」に該当する分岐表現ノードが図8の例における複数の会話データ32に共通に有ることから、それら分岐表現ノードがまとめられる。そして、まとめられた分岐表現ノード(以下、分岐表現の結合ノードとも記す)には、例えば、会話データ32からキーワードとして抽出された「注文」が付与される。なお、1つの結合ノードに付与するキーワードは1つに限定されず、例えば、複数のキーワードが付与されてもよい。また、キーワードは、TF(Term Frequency)-IDF(Inverse Document Frequency)の値を算出し、当該算出された値に基づいて会話データ32から抽出されてもよい。
その後、モデル化部27は、引き続き、注目している会話データ32のノードをリーフに向かって順に辿りながら、分岐表現ノードが有った場合には次のような処理を行う。すなわち、モデル化部27は、ステップS104による分岐表現の結合ノードを共通の親ノードとして持つ他の会話データ32のノードのうち、同様な分岐表現を共通に含む分岐表現ノードが有るか否かをチェックする。これにより、同様な分岐表現を含む分岐表現ノードが他の会話データ32に有る場合には、モデル化部27は、それら同様な分岐表現を共通に含む分岐表現ノード同士を1つのノードにまとめる(S106)。そして、モデル化部27は、その分岐表現の結合ノードに上記同様にキーワードを付与する(S107)。モデル化部27は、さらに、注目している会話データ32に関し、リーフに向かってノードを辿りながら、分岐表現ノードが有った場合には、上述したようなステップS106,S107の処理を繰り返す。そして、注目している会話データ32のリーフまで至った後に、モデル化部27は、注目する会話データ32を、未処理の別の会話データ32に変更し、上記同様なステップS104~S107処理を繰り返す。
然る後に、処理対象の複数の会話データ32の全てについてステップS104~S107の処理を終了すると、モデル化部27は、分岐表現の結合ノード以外のノードにおいて、指定されているノード同士をまとめる(S108)。ここでは、モデル化部27は、会話開始(ルート)から会話終了(リーフ)に向かってノードを辿った場合に最初となる分岐表現の結合ノードと、ルートとの間のノードを1つのノードにまとめる。また、モデル化部27は、親子関係にある分岐表現の結合ノード間のノードを1つのノードにまとめる。そして、モデル化部27は、そのようにまとめたノードにキーワードを付与する。
具体的には、例えば、図4~図6における3つの会話データ32を1つの木構造にモデル化する場合に、図3に表される分岐表現データ「(ご)?注文.*(ですか?|お願いします。)$」に該当する分岐表現ノードが分岐表現の結合ノードとしてまとめられたとする。さらに、その分岐表現の結合ノードにキーワードとして「注文」が付与されたとする。このような場合に、図4~図6における3つの会話データ32におけるリーフからその分岐表現の結合ノードに至るまでの全てのノードが1つのノードにまとめられる。また、このまとめられたノードには、例えば、キーワードとして「登録」、「お客様ID」が付与される。さらに、この場合には、図5の会話データと図6の会話データにおける、注文商品がギフトであるか否かを質問するノードも共通の分岐表現を持つ分岐表現ノードとして特定されて1つのノードにまとめられる。そして、当該まとめられたノードには「ギフト」がキーワードとして付与される。さらに、「注文」に関する分岐表現の結合ノードと、「ギフト」に関する分岐表現の結合ノードとの間の親子関係にある複数のノードが一つにまとめられ、当該まとめられたノードには「商品B」、「商品C」がキーワードとして付与される。図9には、図4~図6における3つの会話データ32に、上記のような分岐表現ノードをまとめる処理と、分岐表現ノード以外の指定されたノード同士をまとめる処理と、まとめたノードにキーワードを付与する処理とが実行された後の具体例が表されている。なお、図9におけるKWはキーワードを表している。
その後、モデル化部27は、各会話データ32における最後の分岐表現の結合データからリーフに至るまでの親子関係にあるノードを返答ノードとしてまとめ、当該返答ノードに返答内容を表すキーワードを付与する(S109)。具体的には、例えば、図9における「商品Aを1つ」という発話のノードからリーフ(図示せず)に至るまでに分岐表現ノードがなかった場合に、「商品Aを1つ」という発話のノードからリーフに至るまでの親子関係にあるノードが返答ノードとしてまとめられる。そして、図10に表されるように、その返答ノードには、会話データから抽出された「商品A」がキーワードとして付与される。また、「はい、ギフトです」という発話のノードからリーフに至るまでに分岐表現ノードがなかった場合に、「はい、ギフトです」という発話のノードからリーフに至るまでの親子関係にあるノードが返答ノードとしてまとめられる。そして、図10に表されるように、その返答ノードには「はい」がキーワードとして付与される。さらに、「いいえ、自宅用です」という発話のノードからリーフに至るまでに分岐表現ノードがなかった場合に、「いいえ、自宅用です」という発話のノードからリーフに至るまでの親子関係にあるノードが返答ノードとしてまとめられる。そして、図10に表されるように、その返答ノードには「いいえ」がキーワードとして付与される。なお、返答ノードには、当該ノードにおける発話内容(返答内容)を表す正規表現のデータがキーワードとして関連付けられていてもよい。
モデル化部27は、上記のように分岐表現に着目し、ノードをまとめることにより、複数の会話データ32を1つの木構造にまとめてモデル化する機能を備えている。
表示制御部28は、表示装置22の画面の表示を制御する機能を備えており、例えば、データ構造化装置20の操作者の要求に応じて、モデル化部27により生成された木構造や、木構造の元となった会話データ32などを表示装置22の画面に表示する。
第2実施形態のデータ構造化装置20は、分岐表現に基づいてノードをまとめることにより、複数の会話に因る表記ゆれや表現のバリエーションがあっても同様な内容のノードをまとめることができる。このため、データ構造化装置20は、複数の会話データ32を1つの木構造にモデル化することができる。また、データ構造化装置20は、分岐表現に基づいてノードをまとめることにより、例えば、複数の会話において同様な会話内容を経て発せられた問いの発話に対する複数の応答(回答の発話)を1つの木構造にまとめることができる。さらに、データ構造化装置20は、分岐表現に着目して複数の会話データを1つの木構造にまとめる。これにより、データ構造化装置20は、第1実施形態と同様に、会話の流れを保ちつつ(つまり、ルートからリーフに向かって辿った場合に会話を再現できる状態で)、複数の会話データを1つの木構造にまとめることができる。換言すれば、第2実施形態のデータ構造化装置20は、複数の会話データを人の手を用いずに1つの木構造にモデル化でき、しかも、会話の流れを考慮しつつ、指定の発話に対する回答の発話例を容易に取得可能な木構造を得ることができる。
なお、データ構造化装置20には、図2の点線に示されるような音声認識部29が備えられていてもよい。音声認識部29は、例えば、マイク(図示せず)により取り込まれた音声データをテキストデータに変換し会話データ32として記憶装置21に格納する機能を備える。
なお、図18は、データ構造化装置20のハードウェア構成の一例を簡略化して表すブロック図である。データ構造化装置20は、例えば、CPU(Central Processing Unit)10と、通信ユニット11と、メモリ12と、入出力IF(Interface)13とを有する。通信ユニット11は、例えば、情報通信網(図示せず)を介して外部の装置に接続し、当該装置との通信を実現する機能を備えている。入出力IF13は、例えば、表示装置や、装置の操作者(ユーザ)が情報を入力するキーボード等の入力装置等に接続し、これら装置との情報(信号)の通信を実現する機能を備えている。メモリ12は、データやコンピュータプログラム(プログラム)を格納する記憶装置である。記憶装置には様々な種類が有り、1つの装置に複数種の記憶装置が搭載されることがあるが、ここでは、包括的に1つのメモリとして表している。CPU10は、演算回路であり、メモリ12に格納されているプログラムを読み出し当該プログラムを実行することにより、上述したようなデータ構造化装置20の処理を実現する機能を備える。
<第3実施形態>
以下に、本発明に係る第3実施形態を説明する。なお、第3実施形態の説明において、第2実施形態のデータ構造化装置を構成する構成部分と同一名称部分には同一符号を付し、その共通部分の重複説明は省略する。
図11は、第3実施形態のデータ構造化装置の構成を簡略化して表すブロック図である。第3実施形態のデータ構造化装置20は、例えば商品の注文を受け付ける注文受付センターのオペレータとそのユーザとの会話を木構造にモデル化することを想定しており、モデル化の処理には、分岐表現データ31に代えて、マニュアルデータ34を利用する。
すなわち、第3実施形態では、記憶装置21には、会話データ32とプログラム33に加えて、マニュアルデータ34が格納されている。マニュアルデータ34は、オペレータがユーザと会話する際の発話例(発話のマニュアル)を表すデータであり、例えば、図12に表されるような発話例データに項目IDが関連付けられている態様を備える。
また、第3実施形態では、データ構造化装置20は、表現受付部25に代えて、取得部である受付部35を備えている。受付部35は、表示制御部28によってマニュアルデータ34における発話例データを表示装置22に表示させる機能を備える。また、受付部35は、表示制御部28によって「表示装置22に表示された発話例データの中から分岐表現として使用する発話例データを指定してほしい」旨のメッセージを表示装置22に表示させる機能を備える。さらに、データ構造化装置20の操作者が、その表示を見て、表示装置22に表示されている発話例データの中から分岐表現として使用する発話例データ(又は項目ID)を1つあるいは複数指定すると、受付部35は、指定された情報を受け付ける機能を備える。そして、受付部35は、その指定された情報に応じた発話例データをマニュアルデータ34から取得し、モデル化部27に分岐表現データとして出力する機能を備えている。
モデル化部27は、発話例データから分岐表現データを取得する以外は、第2実施形態で説明した機能と同様の機能を有し、複数の会話データ32を1つの木構造にモデル化する。なお、モデル化部27が会話データ32における分岐表現ノードを特定する場合に、例えば、あいまい検索等が利用される。また、モデル化部27による処理の流れは第2実施形態で説明したモデル化部27の処理の流れと同様であることから、その説明は省略する。
図13には、モデル化部27によりモデル化された会話データ32の木構造の具体例が表されている。この具体例の木構造は、図12に表されるマニュアルデータの項目IDが「2-1」である発話データ「ご注文は何ですか?」が分岐表現データとして指定された場合に、図4~図6の3つの会話データ32をモデル化したものである。なお、図13と図9にそれぞれ表される木構造は、両方共に図4~図6の会話データを1つの木構造にまとめたモデルであるが、モデル化に使用した分岐表現に差異があることにより、図13と図9のように、木構造に差異が生じている。つまり、図9では、「(ご)?注文.*(ですか?|お願いします。)$」と「(贈り物|ギフト)で(す|しょう)か?$」という2つの分岐表現に基づいてモデル化された木構造が表されている。図13では、「ご注文は何ですか?」という1つの分岐表現に基づいてモデル化された木構造が表されている。また、図13において、図9と同様に、KWはキーワードを表し、OPはオペレータを表し、Uはユーザを表している。
図13の具体例では、分岐表現が「注文」を含む1つの分岐表現であることにより、ルートからその分岐表現を含む分岐表現ノードに至るまでの発話が1つのノードにまとめられている。また、分岐表現(問い)に対する返答の発話が、「KW(キーワード)=商品A」、「KW(キーワード)=商品B」、「KW(キーワード)=商品C」という3つのノードにまとめられている。
第3実施形態のデータ構造化装置20は、第2実施形態と同様に、分岐表現に着目して複数の会話データ32をまとめて1つの木構造にモデル化する構成を備えていることから、第2実施形態と同様の効果を得ることができる。また、第3実施形態のデータ構造化装置20は、分岐表現データとして、発話のマニュアルデータを利用していることから、分岐表現の専用のデータを予め準備する手間を省くことができる。
<第4実施形態>
以下に、本発明に係る第4実施形態を説明する。なお、第4実施形態の説明において、第2や第3の実施形態のデータ構造化装置を構成する構成部分と同一名称部分には同一符号を付し、その共通部分の重複説明は省略する。
図14は、第4実施形態におけるデータ構造化装置の構成を簡略化して表すブロック図である。第4実施形態のデータ構造化装置20は、表現受付部25や受付部35に代えて、取得部である抽出部38が備えている。また、記憶装置21には、抽出パラメータ40が格納されている。抽出パラメータ40は、分岐表現候補を会話データ32から抽出する処理で使用する抽出条件を表すデータである。この第4実施形態では、抽出パラメータ40は、抽出条件を表す出現頻度(例えば、2以上)である。
抽出部38は、抽出パラメータ40に基づいて、処理対象の会話データ32の中から抽出条件に該当する発話(例えば1発話全部や文節や単語など)を分岐表現候補として抽出する機能を備える。例えば、処理対象の会話データが図4、図5、図15に表される3つの会話データであり、抽出パラメータ40が「≧2(2以上)」である場合に、抽出部38は、例えば分岐表現候補として図16に表されるような発話データを抽出する。図16の例では、抽出された発話データ(以下、抽出データとも記す)には当該抽出データを識別する項目IDと、その抽出データが処理対象の複数の会話データ32に出現した頻度(出現頻度)の情報とが関連付けられている。図16に表されるような抽出データは例えば記憶装置21に格納される。
また、抽出部38は、表示制御部28によって、抽出データを表示装置22に表示させる機能を備えている。さらに、抽出部38は、表示制御部28によって、「表示された抽出データの中から分岐表現として使用する発話を指定してほしい」旨のメッセージを表示装置22に表示させる機能を備える。さらにまた、データ構造化装置20の操作者が、表示装置22に表示されている抽出データの中から分岐表現として抽出データ(又は項目ID)を1つあるいは複数指定すると、抽出部38は、指定された抽出データを表す情報を受け付ける機能を備える。そして、抽出部38は、その指定された抽出データを分岐表現データとしてモデル化部27に出力する機能を備えている。
モデル化部27は、抽出部38から分岐表現データを受け取る以外は、第2又は第3の実施形態で説明した機能と同様の機能を有し、第2又は第3の実施形態におけるモデル化部27と同様の処理により、複数の会話データ32を1つの木構造にモデル化する。なお、モデル化部27が会話データ32における分岐表現ノードを特定する場合に、例えば、あいまい検索等が利用される。また、モデル化部27による処理の流れは第2実施形態で説明したモデル化部27の処理の流れと同様であることから、その説明は省略する。
図17には、モデル化部27によりモデル化された会話データの木構造の具体例が表されている。この具体例では、処理対象の会話データ32は、図4、図5、図15に表される3つのデータである。また、それら処理対象の3つの会話データ32の中から、抽出パラメータ40により特定される抽出条件である“出現頻度が2以上である”という条件に基づいて図16に表されるような発話データが抽出部38により抽出データとして抽出されたとする。そして、抽出データの中から、データ構造化装置20の操作者によって「商品Aを一つ」が分岐表現として選択されたとする。この場合に、モデル化部27は、その選択された分岐表現を利用して、図4、図5、図15における3つの会話データ32を図17に表されるような1つの木構造にモデル化する。
図17の具体例では、分岐表現が「商品Aを一つ」という1つの分岐表現であることにより、その分岐表現に至るまでの会話が1つのノードにまとめられている。また、分岐表現に対する返答の会話が、「KW(キーワード)=商品A」、「KW(キーワード)=商品B」という2つのノードにまとめられている。
第4実施形態のデータ構造化装置20は、第2と第3の実施形態と同様に、分岐表現に着目して複数の会話データをまとめて木構造にモデル化する構成を備えていることから、第2や第3の実施形態と同様の効果を得ることができる。また、第4実施形態のデータ構造化装置20は、分岐表現の候補を処理対象の会話データから抽出部38が抽出していることから、分岐表現の専用のデータを予め準備する手間を省くことができる。
<その他の実施形態>
なお、本発明は第1~第4の実施形態に限定されず、様々な実施の態様を採り得る。例えば、第2~第4の実施形態では、会話データをグラフ構造にモデル化する場合に、1発話を1ノードとしているが、ノードの単位は1発話に限定されず、例えば、話者交替(ターン)から次の話者交替(ターン)までの発話が1ノードであってもよい。さらに、1トピックが1ノードであってもよいし、1フェーズが1ノードであってもよい。
また、第2~第4の実施形態では、注文受付センターのオペレータとそのユーザの会話を具体例として、データ構造化装置20の機能を説明しているが、データ構造化装置20がモデル化する会話は、そのような会話に限定されない。データ構造化装置20は、他の同様な状況における複数の会話データを1つの木構造にまとめてモデル化することができる。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は、2017年3月21日に出願された日本出願特願2017-054520を基礎とする優先権を主張し、その開示の全てをここに取り込む。
1,20 データ構造化装置
2 取得部
3,27 モデル化部
25 表現受付部
35 受付部
38 抽出部

Claims (9)

  1. 会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得手段と、
    会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化するモデル化手段と
    を備えるデータ構造化装置。
  2. 前記モデル化手段は、前記複数の会話データにおける会話開始から、会話の流れに沿って、前記分岐表現を含む分岐表現ノードに至るまでのノードをまとめる機能をさらに備える請求項1に記載のデータ構造化装置。
  3. 前記モデル化手段は、前記複数の会話データにおける前記分岐表現ノードよりも会話終了側において、さらに、別の前記分岐表現を共通に含むノードがある場合には、それらノード同士を1ノードにまとめ、また、前記会話データのそれぞれにおいて、前記分岐表現ノードよりも会話終了側に前記分岐表現を含むノードが無い場合には、前記分岐表現ノードよりも会話終了側のノードをまとめる機能をさらに備える請求項2に記載のデータ構造化装置。
  4. 前記モデル化手段は、前記分岐表現ノードに接続される子ノードに、前記分岐表現に対する回答の内容に応じたキーワードを付与する請求項3に記載のデータ構造化装置。
  5. 前記取得手段は、会話の発話例を表すマニュアルデータから前記分岐表現データとして使用する発話例を指定する情報に基づいて、前記マニュアルデータから前記分岐表現データを取得する請求項1乃至請求項4の何れか一つに記載のデータ構造化装置。
  6. 前記取得手段は、前記複数の会話データを解析することにより得られた分岐表現候補の中から前記分岐表現データとして使用する分岐表現候補を指定する情報に基づいて、前記分岐表現候補から前記分岐表現データを取得する請求項1乃至請求項4の何れか一つに記載のデータ構造化装置。
  7. 前記モデル化手段は、複数のノードがまとめられたノードには、当該ノードに含まれる会話内容を表すキーワードを付与する機能をさらに備える請求項1乃至請求項6の何れか一つに記載のデータ構造化装置。
  8. 会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得し、
    会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化するデータ構造化方法。
  9. 会話中において互いに異なる複数の回答が想定される発話表現である分岐表現を表す分岐表現データを取得する取得する処理と、
    会話内容が複数のノードに分けられ当該複数のノードがエッジにより接続されているグラフ構造に変換されている複数の会話データにおいて、前記取得された分岐表現データに基づき前記分岐表現を共通に含む前記ノード同士を1ノードにまとめる処理を行い前記複数の会話データを1つの木構造にモデル化する処理と
    をコンピュータに実行させるコンピュータプログラ
JP2019507626A 2017-03-21 2018-03-16 データ構造化装置、データ構造化方法およびプログラム Active JP7067546B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017054520 2017-03-21
JP2017054520 2017-03-21
PCT/JP2018/010411 WO2018173943A1 (ja) 2017-03-21 2018-03-16 データ構造化装置、データ構造化方法およびプログラム記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2018173943A1 JPWO2018173943A1 (ja) 2020-01-30
JP7067546B2 true JP7067546B2 (ja) 2022-05-16

Family

ID=63584394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019507626A Active JP7067546B2 (ja) 2017-03-21 2018-03-16 データ構造化装置、データ構造化方法およびプログラム

Country Status (3)

Country Link
US (1) US11416555B2 (ja)
JP (1) JP7067546B2 (ja)
WO (1) WO2018173943A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019161229A1 (en) 2018-02-15 2019-08-22 DMAI, Inc. System and method for reconstructing unoccupied 3d space
US11468885B2 (en) * 2018-02-15 2022-10-11 DMAI, Inc. System and method for conversational agent via adaptive caching of dialogue tree
US12001785B2 (en) * 2020-09-10 2024-06-04 International Business Machines Corporation Mining multi-party collaboration platforms to create triaging trees and playbooks

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205552A (ja) 2008-02-28 2009-09-10 Internatl Business Mach Corp <Ibm> パーソナル・サービス支援のための方法、システム、および装置
JP2013105436A (ja) 2011-11-16 2013-05-30 Nippon Telegr & Teleph Corp <Ntt> 対話モデル構築装置、方法、及びプログラム
US20150127631A1 (en) 2013-11-05 2015-05-07 International Business Machines Corporation Best available alternative dialog

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3525513B2 (ja) * 1994-09-30 2004-05-10 株式会社島津製作所 分析装置
JPH09198399A (ja) * 1996-01-17 1997-07-31 Mitsubishi Electric Corp 情報検索支援装置
JP3998668B2 (ja) * 2004-07-14 2007-10-31 沖電気工業株式会社 形態素解析装置、方法及びプログラム
US7849090B2 (en) * 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
JP4451435B2 (ja) * 2006-12-06 2010-04-14 本田技研工業株式会社 言語理解装置、言語理解方法、及び、コンピュータプログラム
WO2010078614A1 (en) * 2009-01-08 2010-07-15 Relevancenow Pty Limited Chatbots
WO2014011208A2 (en) * 2012-07-10 2014-01-16 Venor, Inc. Systems and methods for discovering content of predicted interest to a user
US20140279906A1 (en) * 2013-03-13 2014-09-18 Bart Michael Peintner Apparatus, system and method for multiple source disambiguation of social media communications
US9426259B2 (en) * 2014-02-05 2016-08-23 Fen Research Limited Client server interaction for graphical/audio applications
US10455088B2 (en) * 2015-10-21 2019-10-22 Genesys Telecommunications Laboratories, Inc. Dialogue flow optimization and personalization
US10845937B2 (en) * 2018-01-11 2020-11-24 International Business Machines Corporation Semantic representation and realization for conversational systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205552A (ja) 2008-02-28 2009-09-10 Internatl Business Mach Corp <Ibm> パーソナル・サービス支援のための方法、システム、および装置
JP2013105436A (ja) 2011-11-16 2013-05-30 Nippon Telegr & Teleph Corp <Ntt> 対話モデル構築装置、方法、及びプログラム
US20150127631A1 (en) 2013-11-05 2015-05-07 International Business Machines Corporation Best available alternative dialog

Also Published As

Publication number Publication date
US20200019569A1 (en) 2020-01-16
US11416555B2 (en) 2022-08-16
JPWO2018173943A1 (ja) 2020-01-30
WO2018173943A1 (ja) 2018-09-27

Similar Documents

Publication Publication Date Title
CN110111780B (zh) 数据处理方法和服务器
WO2019200923A1 (zh) 基于拼音的语义识别方法、装置以及人机对话***
JP6819988B2 (ja) 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム
US7966171B2 (en) System and method for increasing accuracy of searches based on communities of interest
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
KR102445519B1 (ko) 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법
US20060129396A1 (en) Method and apparatus for automatic grammar generation from data entries
JP6675788B2 (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
JP7067546B2 (ja) データ構造化装置、データ構造化方法およびプログラム
WO2020106967A1 (en) Semantic crm transcripts from mobile communications sessions
JP5368924B2 (ja) 自然言語ユーザインタフェースを漸進的に開発する装置及び方法
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP2019061482A (ja) 情報処理装置、対話処理方法及び対話システム
US10762906B2 (en) Automatically identifying speakers in real-time through media processing with dialog understanding supported by AI techniques
CN114218375A (zh) 基于图谱的对话引导方法、装置、设备及介质
Gruenstein et al. Scalable and portable web-based multimodal dialogue interaction with geographical databases
JP4441782B2 (ja) 情報提示方法及び情報提示装置
Patil et al. Novel technique for script translation using NLP: performance evaluation
Bangalore et al. Balancing data-driven and rule-based approaches in the context of a multimodal conversational system
CN111324626B (zh) 基于语音识别的搜索方法、装置、计算机设备及存储介质
JP2019174894A (ja) ワークショップ支援システムおよびワークショップ支援方法
JP4881903B2 (ja) 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム
WO2020205817A1 (en) Systems and methods for generating responses for an intelligent virtual assistant
CN112397053B (zh) 语音识别方法、装置、电子设备及可读存储介质
KR20180121120A (ko) 음성, 텍스트, 시각적 인터페이스를 결합하여 모바일 기기로 물건을 구매할 수 있는 머신러닝 기반 음성 주문 시스템

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210215

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220411

R151 Written notification of patent or utility model registration

Ref document number: 7067546

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151