JP2017517776A - 対話処理方法、対話管理システム、およびコンピュータ機器 - Google Patents

対話処理方法、対話管理システム、およびコンピュータ機器 Download PDF

Info

Publication number
JP2017517776A
JP2017517776A JP2016552493A JP2016552493A JP2017517776A JP 2017517776 A JP2017517776 A JP 2017517776A JP 2016552493 A JP2016552493 A JP 2016552493A JP 2016552493 A JP2016552493 A JP 2016552493A JP 2017517776 A JP2017517776 A JP 2017517776A
Authority
JP
Japan
Prior art keywords
data
parameter
task
dialog
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016552493A
Other languages
English (en)
Other versions
JP6514711B2 (ja
Inventor
ゼンタオ ジァオ
ゼンタオ ジァオ
グアンシュン ワン
グアンシュン ワン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2017517776A publication Critical patent/JP2017517776A/ja
Application granted granted Critical
Publication of JP6514711B2 publication Critical patent/JP6514711B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本発明は、対話処理方法、対話管理システム、およびコンピュータ機器に関する。この方法は、タスクに関連付けられたユーザ要求データを取得するステップと、前記ユーザ要求データと、予め設定た、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するステップと、前記対話状態に基づいて少なくとも1つの候補動作データを生成するステップと、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成するステップとを含む。対話システムにおいて係るタスクの対話サービスをカスタマイズすることにより、対話管理システムの拡張性が向上した。【選択図】図2

Description

優先権の主張
本出願は、2014年10月29日に、中国に出願された、出願番号が201410593684.0で、発明の名称が「対話処理方法、および対話管理システム」である中国特許出願の優先権を主張し、当該特許出願の全文を援用するように本願に組み込んだ
本発明は、人間とコンピュータの相互作用に関し、特に対話処理方法、対話管理システム、およびコンピュータ機器に関する。
従来のタスク型対話システムには、音声認識モジュール、自然言語理解モジュール、対話管理モジュール、バックエンドデータ処理モジュール、自然言語生成モジュール、および音声合成モジュールを備える。具体的なタスク指向対話システムを構築する場合、音声認識モジュールと音声合成モジュール以外、他の4つのモジュールのいずれも具体的なアプリケーションタスクに基づいてカスタマイズ開発を必要となっている。
タスクのカスタマイズ開発は、これまで、主に2つの形態があり、
1.具体的なタスクのビジネスロジックに基づいて各モジュールを再開発する。このようにカスタマイズされたシステムは、一般的には、具体的なタスクの要求をよく満足することができるが、開発量が大きい。
2.対話システム状態表示、およびシステム動作を抽象化し、学習を強化する方法を用い、環境との対話型学習により対話システムを構築する。このようにカスタマイズされたシステムは、対話戦略を改善するために多くの対話コーパスを必要となり、実現の難易度も比較的大きく、且つ、学習された戦略の理解性が悪く、システムの制御可能性が低くなる。
本発明は、対話処理技術を提供することを目的とし、対話システムにおいて係るタスクの対話サービスをカスタマイズすることにより、対話管理システムの拡張性を向上する。
本発明の一態様によれば、タスクに関連付けられたユーザ要求データを取得するステップと、前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するステップと、前記対話状態に基づいて少なくとも1つの候補動作データを生成するステップと、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成するステップとを含む対話処理方法を提供する。
本発明のもう1つの態様によれば、タスクに関連付けられたユーザ要求データを取得するための要求取得装置と、前記要求取得装置で取得されたユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するための対話状態更新装置と、前記対話状態更新装置で更新された対話状態に基づいて少なくとも1つの候補動作データを生成するための動作生成装置と、前記動作生成装置で生成された少なくとも1つの候補動作データに基づいて応答テキストデータを生成するためのテキスト生成装置とを備える対話管理システムを提供する。
本発明のもう1つの態様によれば、コンピュータ機器を提供する。このコンピュータ機器は、1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを備え、その中で、前記1つ以上のプログラムは、前記メモリに記憶され、且つ前記1つ以上のプロセッサにより前記1つ以上のプログラムに含まれた対話処理方法を実行するための命令が実行されるように構成され、前記命令は、タスクに関連付けられたユーザ要求データを取得し、前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新し、前記対話状態に基づいて少なくとも1つの候補動作データを生成し、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成する命令である。
本発明に係る対話処理方法、対話管理システム、およびコンピュータ機器は、対話システムにおいて係る具体的なタスクの対話サービスをカスタマイズすることができ、且つ対話管理システムにより、カスタマイズの対話サービスに対して対話のインタラクティブな処理をすることができ、したがって、新たなタスクの対話サービスが導入された場合、対話サービスを再開発する必要がなく、対話状態パラメータおよび処理ルールを設定する必要があるだけで、前記対話管理システムの拡張性を大幅に向上させ、且つ、開発や配置のコストを節約した。
本発明の例示的な実施例に係る対話管理システムが使用された対話サービスのカスタマイズの全般的枠組みを示す図である。 本発明の例示的な実施例に係る対話処理方法を示すフローチャートである。 本発明の例示的な実施例に係る対話パラメータの例を示す図である。 本発明の例示的な実施例に係るHTTPデータアクセスのアクセス設定の例を示す図である。 本発明の例示的な実施例に係るデータベースアクセスのアクセス設定の例を示す図である。 本発明の例示的な実施例に係る対話パラメータのプロパティ設定の例を示す図である。 本発明の例示的な実施例に係る対話管理システムを示す論理図である。 本発明の例示的な実施例に係るコンピュータ機器を示す論理図である。
本発明の全体的な構想は、タスクに関連する対話管理システムを提供し、具体的なタスクに関連するビジネスロジック機能モジュールに対してタスク設定を行って具体的なタスクに関連する対話管理を実現することにより、前記対話管理システムを利用して新たなタスクの対話カスタマイズを実現することができ、前記新たなタスクに関連する対話サービスの再開発を必要としなく、ユーザが迅速にカスタマイズの対話管理システムを使用することを可能にさせる。一方、対話のインタラクティブな処理において、前記対話管理システムによりユーザの対話状態を管理し、且つ、既存のタスク設定に基づいて応答テキストを生成することができる。
ここでいわゆるタスク設定は、タスクに関連する対話状態のパラメータ設定、およびタスクに関連するビジネスルール設定を含む。
以下、本発明の例示的な実施例に係る対話処理方法、対話管理システム、およびコンピュータ機器について、図面を参照して詳細に説明する。
本発明に係るデータ、ルール、および本発明の構想を直観的に説明するために、本明細書において、単に航空券の予約タスクのみを例としてサービスのカスタマイズ、対話のインタラクティブな処理、および対話管理を具体的に説明する。本発明に係るアプリケーションは、航空券の予約に限らず、食事の予約、ホテルの予約、映画チケットの予約などの様々な複数回の対話に関連する対話タスクに適用されていることを、当業者にとって理解すべきである。
図1は、本発明の例示的な実施例に係る対話管理システムが使用された対話サービスのカスタマイズの全般的枠組みを示す。本発明に係る対話サービスのカスタマイズは、主にブロック130〜160に関連する。
図1に示すように、ブロック110は、ユーザから入力された自然言語表現のユーザ要求テキストを受信するために構成される。ブロック120は、自然言語分析により前記ユーザ要求テキストの分析結果を得るために構成される。
この後、ブロック130は、前記分析結果と、環境特徴パラメータと組み合わせてユーザの対話状態を更新するために構成される。当該モジュールは、主に対話管理システムの状態を記録・メンテナンスするために構成される。
例えば、ユーザが「私は上海への航空券を予約したい」というと、前記テキストに対して自然言語分析を行った後に、「航空券予約」というユーザの意図(すなわち、タスク)を得ることができる。次に、対話時の現在時間、ユーザ所在地、動作履歴などの情報を含む環境情報を抽出する。
対話カスタマイズを行う場合、当該タスクに関連するタスクパラメータの状態を示すためのスロットリストを予め設定してもよい。例えば、「航空券予約」のサービスをカスタマイズする場合、関連するスロットには、出発地、目的地、出発日期、出発時刻、座席のタイプ、飛行機のタイプ、航空券の価格、航空会社、出発空港、到着空港などを含む。また、前記タスクに関連付けられた場面事前情報、例えば、時間事前情報(何月、何曜日、何時などを含み)、地域事前情報(工業都市か否か、観光地か否か、都市の規模タイプなどを含み)、および動作履歴情報(例えば、前回のクエリから今までのインタラクティブなラウンド数、前回の確認から今までのインタラクティブなラウンド数など)を設定してもよい。
必要に応じて、複数のスロットにより前記タスクに関連付けられた前記タスクパラメータの状態を示し、事前場面情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルとして示す。
図3は、本発明の例示的な実施例に係る対話パラメータの例を示す。その中で、複数のプロパティのスロットを介してタスクパラメータの状態を示し、前記スロットの状態は、ヌル(null)、デフォルト値、多値、エラー値および正常値から選ばれる1つであってもよく、特徴ベクトルにより時間事前情報、地域事前情報、および動作履歴情報を示す。
この後、ブロック140は、更新された対話状態を検査し、且つ少なくとも1つの候補動作データ(140)を生成するために構成される。当該モジュールは、主な目的として、現在の対話状態に基づき、システムの全ての動作から現在有効なシステム動作のみを濾し取り、システム動作の決定段階のエラー率を減少し、候補動作リストを出力する。
当該モジュールで行われた検査は、スロットのデフォルト値の検査、要求詳細化の検査(パラメータ間のプロパティ依存の検査、およびパラメータ間のプロパティトリガの検査を含み)、パラメータ値確認の検査、およびパラメータの明確化を含んでもよいが、これらに限定されていない。以下、前記複数の検査を具体的に説明し、且つ対話カスタマイズにおいて前記検査のルールを設定する。
スロットのデフォルト値の検査
特定のタスクに対して、一定の対話状態において、いくつかの特徴/プロパティについて、デフォルト値を取ってもよく、値の源は、タスクカスタマイズに由来してもよく、ユーザモデル(例えば、ユーザプロファイル、およびインタラクチィブな履歴など)に由来してもよい。
タスクカスタマイズの条件またはユーザモデル情報を検査することにより、条件を満たすデフォルト値が存在する場合、候補スロット値のデフォルト動作を生成する。例えば、1人のユーザが常にエコノミークラス航空券を予約する場合、チケット予約の対話を新たに起動する時に、航空券座席のタイプが「エコノミークラス」である1つのスロット値デフォルト動作を生成してもよい。
サービスのカスタマイズを行う場合、当該動作を必要とするアプリケーションタスクに対して、開発者は、デフォルト値の設定、およびユーザモデルサービスの設定を行いてもよく、設定デフォルトがこのような動作を使用しないことを表示する。デフォルト値の設定は、宛先スロット、デフォルト値、およびデフォルト条件を含む。例えば、航空券タスクにおいて、次のように設定してもよく、
flightflight_leave_date [today] TARGET=flight_status
(フライト状況をクエリする場合、出発日は、今日をデフォルトとする)
ユーザモデルサービスのインターフェース(サービスのIPアドレスおよびポートを含み)を、前記ユーザモデルによりスロットデフォルト値の検査を行うように設定してもよい。例えば、
user_model_ip:10.81.14.98
user_model_port:6101
要求詳細化検査
宛先タスクを達成するために、ユーザに必要な特徴情報を自発的にクエリすることを必要とする場合がある。
例えば、航空券の予約を達成するために、ユーザによって目的地が提供された場合、ユーザに出発地および出発日をクエリする必要がある。現在の状態では、プロパティ依存の検査、およびプロパティトリガの検査によりユーザの要求を詳細化処理することができる。
プロパティ依存とは、宛先タスクの達成に依存するパラメータ(スロット)を意味し、例えば、航空券の検索は、出発地、目的地、出発日に依存してもよく、航空券の価格は、フライト番号および座席タイプなどに依存してもよく、アプリケーション開発者は、これらの依存情報を容易に予め設定することができる。プロパティトリガとは、連続性要求を有するユーザに対し、1つの要求を満たした後に、次の1つの要求を達成するために、次の要求に依存するパラメータ(スロット)を自発的にクエリする必要があることを意味する。例えば、航空券とホテルとの混合タスクにおいて、ユーザが航空券を予約した後に、対話サービスは、目的地にどこかのホテルを予約したいかとユーザにクエリしてみてもよい。
サービスのカスタマイズを行う場合、アプリケーション開発者は、要求に基づいてプロパティ依存、およびプロパティトリガを設定してもよく、設定デフォルトが、このような動作を使用しないことを表示する。例えば、フライトの価格検索のプロパティ依存関係は、
flightflight_price flight_num| flight_seat_grade
を含んでもよい。
(フライトの価格は、フライト番号、および座席タイプに依存する)
flightflight_price
flight_origin|flight_destination|flight_leave_date|flight_seat_grade
(フライトの価格は、出発地、目的地、出発日、座席タイプに依存する)
プロパティトリガ関係:
Flight END hotel=hotel_place
(航空券の検索が終了した後に、ホテルの場所のクエリをトリガする)
パラメータ値確認の検査
受信されたあるスロット値の信頼度がそんなに高くない場合、当該値であるか否かを、ユーザに確認する必要がある。確認の必要があるパラメータは、自然言語処理で出力された低信頼度のスロット値、ユーザモデルで推奨されたスロット値などを含む。
このため、現在の対話状態が低信頼度のスロットまたはユーザモデルで推奨されたスロットを含むか否かをチェックすることができる。低信頼度のスロットまたはユーザモデルで推奨されたスロットを含む場合、パラメータ値が確認された候補動作データを生成する。
パラメータ明確化の検査
前記パラメータ明確化とは、現在の対話状態に曖昧さを含んでいる際に、対話サービスは、パラメータに関する具体的な意味をユーザにクエリすることを指す。このような問題は、主に、1つの値が複数の意味を持っている可能性のあるケース、またはあるスロットが複数の値を取る可能性のあるケースにつながっている。例えば、対話サービスが「お客さんは、どこからどこへの航空券を予約したいですか」とクエリすると、ユーザが「北京」と答えた場合、「北京」は、出発地か目的地か、どれも可能があるため、ユーザに明確化する必要がある。また、例えば、ユーザが「私は広東への航空券を予約したい」という要求を提出した場合、広東が複数の都市に空港を有するため、ユーザが具体的にどこの都市へ行きたいかをクエリする必要がある。
このため、パラメータ明確化検査処理において、現在ユーザの対話状態が曖昧なスロットまたは曖昧な値を含むか否かを検査する。曖昧なスロットまたは曖昧な値を含んだ場合、明確化候補動作を生成する。
この後、好ましくは、前記ユーザの対話状態および決定ルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択するためのブロック150をさらに設定する。
ブロック140が複数の候補動作データを生成した場合、予め設定された決定ルールにより前記複数の候補動作データから1つを選択して確定された好適な動作データとしてもよい。
前記決定ルールは、所定の動作優先順位、または予め設定された動作決定のモデルであってもよい。
例えば、明確化動作、確認動作、スロット値デフォルト動作、要求詳細化動作(プロパティ依存、またはプロパティトリガ)のような(優先順位が高から低への)順序にしたがって好適な動作を選択するように予め設定してもよい。
一方、訓練サンプルで訓練された動作決定モデルにより、前記複数の候補動作に対して特徴関数の値を計算し、計算された特徴関数の値が最も高い候補動作データを選択し、前記好適な動作データとする。
ブロック160は、前記好適な動作データに基づいて応答テキストデータを生成し、且つ、前記応答テキストデータをユーザに返すために構成される。その中で、デフォルト動作として確定された好適な動作に対してデフォルト値を付与してもよく、前記好適な動作データに基づいてデータソースをアクセスし、所望のデータを呼び出して前記応答テキストデータを生成する。
ここで、前記データソースは、ローカルデータソース、HTTPネットワークデータソース、および/またはデータベースデータソースであってもよい。
サービスのカスタマイズにおいて、開発者は、タスクの需要、およびリソース態様に基づいて、好適なデータアクセス形態または複数種類のアクセス形態の組合せを選択してもよい。
例えば、ローカルファイル登録の形態によってリソースファイルを対話管理システムに入れて、登録ファイルにおいて行ごとに1つのローカルリソースファイルを登録し、ファーマットの例は次の通りである。
flight:flight.data flight_num|flight_origin|flight_destination|…
(領域名:データファイル名\tデータファイルにおける行ごとの形式)
HTTPネットワークデータソースのアクセスは、通常、JSONフォーマットのデータの戻りだけをサポートし、設定の時には、HTTPサービスのドメイン名およびパラメータリストフォーマット、および結果JSONデータフォーマットを明記する必要がある。例えば、図4は、本発明の例示的な実施例に係るHTTPデータアクセスのアクセス設定の例を示す図である。その中で、タスクのタイプは航空券予約であり、ネットワークアドレスのプレフィックスは、
url_domain:rec.***.com/travel/ctrip/domestic_flight?であり、パラメータファーマットは、dcity=[flight_origin]&acity=[flight_destination]&date=[flight_leave_date]であり、且つ、データファーマットをJSONとする。図5は、本発明の例示的な実施例に係るデータベースアクセスのアクセス設定の例を示し、ここで、その中におけるデータフィールドの詳細な説明を省略する。
また、生成された応答テキストデータは、結果の要約、目標の結果、および/またはインタラクティブな問題テキストであってもよい。結果の要約は、複数のDATAから戻されたデータの要約表示であり、例えば航空券予約タスクにおいて、ある日に北京から上海へのフライトが20便がある場合、結果の要約は、これらの結果に対して重要な情報を一括に表示させる。目標の結果が以下のようなデータであり、すなわち、確かなスロット要求を有する場合、情報結果表示の生成を正確にさせ、例えば、ユーザは、北京から上海への格安航空券がいくらであるかと聞いた場合、提供される具体的なデータである。インタラクティブな問題とは、要求詳細化、値の確認、明確化の際に、システムがユーザに対して自発的に問題を生成し、例えばユーザに「お客さんは、いつ出発したいですか」、「お客さんは、エコノミークラス航空券を予約したいですか」、「お客さんの目的地は具体的にどちらですか、例えば広州、深セン、東莞など」。
前記の全般的枠組みにおいて、ブロック150を設定しなく、ブロック160により、生成された任意の候補動作データに基づいて、前記応答テキストデータを生成してもよい。
また、好ましくは、前記全般的枠組みにおいて、さらに、衝突検査および/または数値推定(ブロック170)を設定してもよい。前記ブロック170は、ブロック2において更新しようとする対話状態データに対して衝突検査および/または数値推定を行い、および/または、ブロック160においてデータソースアクセスにより呼び出されたデータに対して衝突検査および/または数値推定を行うために構成されてもよい。
以下、図6を参照しながら、衝突検査および/または数値推定のルール設定およびカスタマイズについて、具体的に説明する。図6は、本発明の例示的な実施例に係る対話パラメータのプロパティ設定の例を示す。
ブロック170において、対話パラメータの値域を超えた衝突、対話パラメータ間で発生する従属関係衝突、および対話パラメータ間で発生するパラメータ値比較関係衝突のうちの少なくとも1つのデータ衝突を設定してもよい。
値域を超えた
値域を超えたこととは、スロット値(特性値)が予め定義された値の範囲を超えたことを指す。例えば、航空券予約タスクにおいて、ユーザは、「濮陽への航空券を予約したい」という要求を提出したが、濮陽に空港がないので、目的地の都市が値の範囲を超えた。
サービスのカスタマイズの過程において、各スロットの値域が定義されてもよい。例えば、図6に示すように、flight_origin(フライト出発地)の値の範囲をファイルflight_origin_rangeに設定する。[]を用いて整数、浮動小数点数(Int、float)タイプなどのデータを示す。
従属関係衝突
2つの互いに従属関係を持っているスロットは、それぞれ対応した値の間に、このような従属関係を満たしていない場合、衝突が発生することになる。例えば、ユーザは、「北京への航空券を予約したい」、「虹橋空港へ行きたい」という要求をそれぞれ提出した場合、空港および都市の間に従属関係を持っているため、スロット値の間にそのような関係の衝突発生があるかどうかをチャックする必要がある。
サービスのカスタマイズにおいて、スロット間の従属関係データが定義されてもよい。例えば、図6に示すように、「flight_origin>flight_ori_airport」は、出発空港が出発都市に従属することを示し、そして、具体的な従属関係データは、ファイルorigin_airportから検索できる。
パラメータ値比較衝突
いくつかのスロット(特徴)の間に、一定の比較関係、例えば、より大きい関係、より小さい関係、不等関係などを持っている。特定のスロットに対応した値の間にこのような関係を満たさない場合、衝突が発生することになる。例えば、ユーザは、それぞれ「私は、上海への航空券を予約したい」、「上海から出発します」という要求を提出した場合、出発地を目的地と同じに設定することができなく、この場合に、いずれも上海であるため、衝突が発生した。
サービスのカスタマイズにおいて、より大きい関係スロット、より小さい関係スロット、不等関係スロットなどを含む、スロット間の比較関係のカスタマイズが定義されてもよい。例えば、図6に示すように、「uneq:flight_destination」は、「flight_origin(フライト出発地)」を「flight_destination(フライト目的地)」と同じに設定してはいけないことを示す。
ブロック170において、さらに、下記の少なくとも1種のデータ推定ルールを設定してもよい。
算術演算
プロパティの間に算術演算関係を持っている場合、既存の値に基づいて、加減乗除などを含む演算により新規なスロット値が得られる。例えば、航空券価格の割引は、航空券の原価を航空券の現価で割って得られた値に等しい。このため、航空券の原価1000元、航空券の現価300元である場合、除算により、航空券の割引は3.0割引の結果が得られる。
サービスのカスタマイズにおいて、スロット間の算術演算関係(arithmetic_operations)が定義されてもよい。例えば、図6に示すように、チケット価格の割引スロットを、次のように設定してもよく、
arithmetic_operations:flight_ticket_price/flight_ticket_ori_price。
新しい値の導入
タスクにおいて、1つのスロットの値は、その他の1つのスロットの値により完全に確定されることができる場合、依存されたスロット値が確定された後に、その依存スロットの値を相応に更新することができる。例えば、航空券予約のタスクにおいて、ユーザがフライト3u8994便に乗りたいと言った場合、対話サービスは、出発地が南京で目的地が成都であることを、直接にバックエンドから取得することができる。
サービスのカスタマイズにおいて、スロット間のトリガ関係(trigger)が定義されてもよい。例えば、図6に示すように、フライト番号スロットを、
trigger: flight_origin|flight_destination {air_line}として表示されてもよい。
古い値の消去
2つのスロット値の間に相互排除関係が存在し、その中の1つのスロットを更新した後に、領域スロット値との相互排除が現われた場合、その中の1つのスロットの値を消去する必要がある。例えば、列車乗車券予約のタスクにおいて、ユーザが寝台列車に乗りたいと言った場合、履歴プロパティにおいて高速鉄道列車のタイプを有すれば、列車タイプと座席タイプとが衝突し、その中の1つのプロパティ値を消去する必要がある。
サービスのカスタマイズにおいて、スロット間の相互排除関係(exclusion)が定義されてもよい。例えば、 座席タイプスロット(train_seat_grade)は、
e xclusion: train_seat_grade {ticket_seat_map}として表示されてもよい。
以上、図1を参照しながら、対話管理システムにおいて具体的なタスクに関連する対話サービスのカスタマイズについて詳細に説明した。当該対話管理システムにより、新規なタスクの対話サービスを設計する場合、前記タスクの対話サービスを再開発する必要がなく、新しいタスクに関連する対話状態パラメータおよびルールに対する設定/カスタマイズだけを必要とすることで、前記対話管理システムの拡張性を大幅に向上させ、且つ、開発や配置のコストを節約した。
以下、図2を参照しながら、本発明の例示的な実施例に係る対話処理方法を詳細に説明する。
図2は、本発明の例示的な実施例に係る対話処理方法を示すフローチャートである。図1に示すカスタマイズされたブロック130〜ブロック160により、前記対話処理方法を実行する。
図2を参照し、ステップS210において、タスクに関連付けられたユーザ要求データを取得する。
本発明の例示的な実施例に基づいて、前記ユーザ要求データは、ユーザ要求テキストデータに対して自然言語分析を行って得られた分析結果、例えば図1におけるブロック120による自然言語分析処理により得られた分析結果を含む。
ステップS220において、前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新する。
前記ブロック130に対して既にカスタマイズしたため、前記分析結果に基づいてブロック130にカスタマイズされた対話パラメータを更新することができる。
具体的には、本発明の例示的な実施例に基づいて、前記分析結果が、対話の初回インタラクションを表わす場合、前記分析結果に基づいて予め設定された、前記タスクに関連付けられたタスクパラメータを取得し、且つ、前記タスクに関連付けられた前記予め設定のタスクパラメータ、および事前場面情報に基いて対話パラメータを生成する。
本発明の選択可能な実施例に基づいて、複数のスロットにより前記タスクに関連付けられた前記タスクパラメータの状態を表示し、事前場面情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルとして示す。
例えば、初回のインタラクションにおいて、ユーザの意図/タスクが航空券予約であることを知った場合、ブロック130のカスタマイズに基づいて、出発地、目的地、出発日、出発時刻、航空券座席、現在時刻、現在場所、何月、何曜日、何時、工業都市か否か、観光地か否か、都市の規模タイプ、前回のクエリから今までのインタラクティブなラウンド数、前回の明確化から今までのラウンド数などを含む対話パラメータを生成し、且つ、分析結果に含まれたデータ、および環境情報に基づいて、前記対話パラメータを更新する。
この後、ステップS230において、前記対話状態に基づいて少なくとも1つの候補動作データを生成する。
具体的に、ステップS230は、予め設定された検査条件に基づいて前記対話パラメータに状態検査を行って、且つ、前記状態検査の結果に基づいて前記少なくとも1つの候補動作データを生成することを含んでもよい。
前記のように、ブロック140において、既に複数の検査条件がカスタマイズされた。前記予め設定された検査条件は、スロットデフォルト値検査条件、パラメータ間のプロパティ依存検査条件、パラメータ間のプロパティトリガ検査条件、パラメータ値確認検査条件、およびパラメータ明確化条件のような検査条件のうちの少なくとも1つを含んでもよい。
例えば、航空券予約のタスク対話の初回のインタラクションにおいて、航空券座席をデフォルトとして「エコノミークラス」に設定してもよく、また、例えば、航空券予約のタスク対話の初回のインタラクションにおいて、航空券の検索が出発地、目的地、出発日に依存し、航空券の価格がフライトの便名および航空券座席に依存するため、これらの情報をクエリする候補動作を生成する必要があり、また、例えば、前回のインタラクションにおいて「お客さんは、どこからどこへの航空券を予約したいですか」とクエリした後に、ユーザが「北京」と答えた場合、北京は、出発地か目的地か、どれも可能であるため、ユーザに目的地か出発地かを明確化する候補動作を生成する必要がある。
ステップS240において、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成する。ここで、前記少なくとも1つの候補動作データにおける任意の候補動作データに基づいて、前記応答テキストデータを生成する。動作のタイプに基づいて、生成された応答テキストデータは、結果の要約、目標の結果、および/またはインタラクティブな問題テキストであってもよい。
応答テキストデータを生成する過程において、前記応答テキストデータに必要なパラメータデータを呼び出して生成する(例えば、出発地、目的地、出発日に基づいてフライト情報を検索する)ように、ローカルまたは外部データソースへのアクセスに関連してもよい。本発明の例示的な実施例によれば、ステップS240においては、更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから、応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップをさらに含んでもよい。
応答テキストデータを生成する過程において、さらに、デフォルト値を用いる対話パラメータに関連してもよく、この場合に、前記対話パラメータのデフォルト値を充填する必要がある。
本発明の好適な実施例によれば、前記方法においては、前記ユーザの対話状態および決定ルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択するステップをさらに含んでもよい。前記決定ルールは、予め設定された動作優先順位、および予め設定された動作決定のモデルの1つであってもよい。
前記決定ルールが、予め設定された動作決定モデルである場合、前記の少なくとも1つの候補動作データから好適な動作データを選択するステップにおいては、前記動作決定モデルに基づいて各前記候補動作データに対応した特徴関数値をそれぞれ取得し、前記特徴関数値における最大値に対応した候補動作データを選択して前記好適な動作データとするステップを含む。予め訓練された動作決定モデルにより候補動作を選択することで、前記タスクに適し、且つ現在対話状態に適する動作データをより確実に確定することができる。
本発明の前記好適な実施例によれば、ステップS240において、前記好適な動作データに基づいて応答テキストデータを生成する。ステップS240においては、更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから、応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップを含んでもよい。ステップS240においては、前記好適な動作データに必要なパラメータデータがデフォルト値である場合、相応のデフォルト値で前記パラメータデータを充填するステップをさらに含んでもよい。
図1に示す対話カスタマイズ処理において、さらに、ブロック170をカスタマイズしてもよい。このため、本発明の好適な実施例によれば、ステップS220においては、更新しようとする対話パラメータの値に対して、それぞれデータ衝突を検出し、且つ、データ衝突が検出された場合、更新された対話パラメータの値を消去し、または、更新しようとする対話パラメータの値が正確であるか否かを確認するためのメッセージを送信するステップをさらに含む。
その中で、前記データ衝突は、対話パラメータの値域を超えた衝突、対話パラメータ間で発生する従属関係衝突、および対話パラメータ間で発生するパラメータ値比較関係衝突のうちの少なくとも1つの衝突を含んでもよい。
本発明の他の好適な実施例によれば、ステップS220においては、更新しようとする対話パラメータの値に対して、それぞれパラメータ値を推定し、且つ、推定された値により前記対話パラメータを更新するステップをさらに含む。
前記パラメータ値の推定は、パラメータ値の算術演算、新しいパラメータ値の導入、およびパラメータ値の古い値の消去などを含んでもよい。前記パラメータ値の推定の処理については、既に図1におけるブロック170の設定およびカスタマイズを参照して具体的に説明した。
本発明の他の好適な実施例によれば、ステップS240においては、取得されたパラメータデータに対して、それぞれデータ衝突を検出し、且つ、データ衝突が検出された場合、データ衝突が検出されたパラメータデータを捨てるステップをさらに含んでもよい。同様の理由で、ステップS240においては、取得されたパラメータデータに対して、それぞれパラメータ値を推定し、且つ、推定された値および前記好適な動作データにより前記応答テキストデータを生成するステップをさらに含んでもよい。
上記のように、図1〜図6を参照しながら、本発明の実施例に係る対話管理システムの複数のモジュールの設定、およびカスタマイズ、並びに本発明の実施例に係る対話処理方法に対する詳細な説明からわかるように、本発明に係る対話処理方法は、対話システムにおいて係る具体的なタスクの対話サービスをカスタマイズすることができ、且つ対話管理システムにより、カスタマイズの対話サービスに対して対話のインタラクティブな処理をすることができ、したがって、新たなタスクの対話サービスが導入された場合、対話サービスを再開発する必要がなく、対話状態パラメータおよび処理ルールを設定する必要があるだけで、前記対話管理システムの拡張性を大幅に向上させ、且つ、開発や配置のコストを節約した。
図7は、本発明の例示的な実施例に係る対話管理システムを示す論理図である。
図7を参照し、本発明の例示的な実施例に係る対話管理システムは、要求取得装置710と、対話状態更新装置720と、動作生成装置730と、テキスト生成装置740とを備える。
要求取得装置710は、タスクに関連付けられたユーザ要求データを取得するために構成される。本発明の例示的な実施例に基づいて、前記ユーザ要求データは、ユーザ要求テキストデータに対して自然言語分析を行って得られた分析結果を含む。
対話状態更新装置720は、要求取得装置710で取得されたユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するために構成される。
本発明の例示的な実施例によれば、前記分析結果が、対話の初回インタラクションを表わす場合、対話状態更新装置720は、前記分析結果から前記タスクに関連付けられた予め設定のタスクパラメータを取得し、予め設定た、前記タスクに関連付けられたタスクパラメータと場面事前情報に基いて対話パラメータを生成し、且つ、前記分析結果に基づいて前記対話パラメータを更新するために構成される。
本発明の例示的な実施例によれば、対話状態更新装置720は、さらに、複数のスロットにより前記予め設定た、前記タスクに関連付けられたタスクパラメータの状態を示し、且つ、場面事前情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルに示すために構成される。
動作生成装置730は、対話状態更新装置720で更新された対話状態に基づいて少なくとも1つの候補動作データを生成するために構成される。
具体的に、動作生成装置730は、予め設定された検査条件に基づいて前記対話パラメータに状態検査を行って、且つ、前記状態検査の結果に基づいて前記少なくとも1つの候補動作データを生成するために構成される。
前記予め設定された検査条件は、スロットデフォルト値検査条件、パラメータ間のプロパティ依存検査条件、パラメータ間のプロパティトリガ検査条件、パラメータ値確認検査条件、およびパラメータ明確化条件からなる検査条件のうちの少なくとも1つを含む。
テキスト生成装置740は、動作生成装置730で生成された少なくとも1つの候補動作データに基づいて応答テキストデータを生成するために構成される。
本発明の好適な実施例によれば、前記システムは、動作決定装置(図示せず)をさらに備え、前記動作決定装置は、前記ユーザの対話状態および決定ルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択するために構成され、且つ、テキスト生成装置740は、前記好適な動作データに基づいて応答テキストデータを生成するために構成される。
前記決定ルールは、予め設定された動作優先順位、および予め設定された動作決定のモデルの1つであってもよい。
その中で、前記動作決定装置は、前記動作決定モデルに基づいて各前記候補動作データに対応した特徴関数値をそれぞれ取得し、前記特徴関数値における最大値に対応した候補動作データを選択して前記好適な動作データとするために構成される。
本発明の好適な実施例によれば、テキスト生成装置740は、更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するために構成される。
本発明の選択可能な実施例によれば、前記好適な動作データに必要なパラメータデータがデフォルト値である場合、テキスト生成装置740は、相応のデフォルト値で前記パラメータデータを充填する。
本発明の好適な実施例によれば、前記システムは、データ衝突検出装置(図示せず)をさらに備える。対話状態更新装置720および/またはテキスト生成装置740は、前記データ衝突検出装置によりデータ衝突を検出することができる。
前記データ衝突検出装置は、対話パラメータの値域を超えた衝突、対話パラメータ間で発生する従属関係衝突、および対話パラメータ間で発生するパラメータ値比較関係衝突のうちの少なくとも1つのデータ衝突を検出する。
前記データ衝突検出装置は、対話状態更新装置720の更新しようとする対話パラメータに対してデータ衝突を検出する。データ衝突が検出された場合、対話状態更新装置720は、既に更新された対話パラメータの値を消去したり、更新しょうとする対話パラメータの値が正確であるか否かを確認するためのメッセージを送信したりする。
前記データ衝突検出装置は、テキスト生成装置740で取得されたパラメータデータに対してそれぞれデータ衝突を検出する。前記データ衝突検出装置がデータ衝突が検出された場合、テキスト生成装置740は、データ衝突が検出されたパラメータデータを捨てる。
本発明の他の好適な実施例によれば、前記システムは、データ推定装置(図示せず)をさらに備える。対話状態更新装置720および/またはテキスト生成装置740は、前記データ推定装置によりデータ値を推定することができる。
前記データ推定装置は、対話状態更新装置720の更新しようとする対話パラメータの値に対して、それぞれパラメータ値を推定し、対話状態更新装置720は、推定された値により前記対話パラメータを更新する。
前記データ推定装置は、テキスト生成装置740で取得されたパラメータデータを、それぞれパラメータ値を推定し、テキスト生成装置740は、推定された値と前記好適な動作データにより前記応答テキストデータを生成する。
上記のように、図面を参照しながら、本発明の実施例に係る対話管理システムの複数のモジュールの設定およびカスタマイズ、本発明の実施例に係る対話処理方法、並びに対話管理システムに対する詳細な説明からわかるように、本発明に係る対話処理方法、および対話管理システムは、対話システムにおいて具体的なタスクに係る対話サービスをカスタマイズすることができ、且つ対話管理システムにより、カスタマイズの対話サービスに対して対話のインタラクティブな処理をすることができ、したがって、新たなタスクの対話サービスが導入された場合、対話サービスを再開発する必要がなく、対話状態パラメータおよび処理ルールを設定する必要があるだけで、前記対話管理システムの拡張性を大幅に向上させ、且つ、開発や配置のコストを節約した。
図8は、本発明の例示的な実施例に係る対話管理に用いられるコンピュータ機器を示す論理図である。
図8を参照し、前記コンピュータ機器は、前記実施例で提供された対話処理方法を実施するために構成されてもよい。具体的には、次の通りである。
コンピュータ機器には、入力ユニット810、オーディオ回路820、コンピュータ読み取り可能な記録媒体を1つ以上含むメモリ830、処理コアを1つ以上含むプロセッサ840、表示ユニット850、通信ユニット860、および電源870などの部品を備えてもよい。図面に示すコンピュータ機器の構成は、コンピュータ機器を限定するものではなく、当該コンピュータ機器は、図示した部品よりも多いまたは少ない部品を備えてもよく、あるいは、いくつかの部品とを組み合わせてもよく、または異なる部品配置にしてもよいことを、当業者は理解すべきである。
入力ユニット810は、デジタルまたはキャラクター情報の入力を受信し、且つ、ユーザ設定および機能制御に関連するキーボード、マウス、ジョイスティック、光学ボールやトラックボールによる信号入力を発生させるために構成されてもよい。好ましくは、入力ユニット810は、タッチセンシティブ表面811、および他の入力装置812を備えてもよい。タッチセンシティブ表面811は、タッチパネルやタッチパッドとも呼ばれ、ユーザがその表面上や付近のタッチ操作(例えば、ユーザが指やタッチペンなどの任意の適した物や付属品を使用して、タッチセンシティブ表面811上やタッチセンシティブ表面811付近に対して行う操作)を収集し、且つ予め設定されたプログラムにしたがって、関連の接続装置を駆動することができる。必要に応じて、タッチセンシティブ表面811は、タッチ検出装置と、タッチ制御器との2つの部分を備えてもよい。ここで、タッチ検出装置は、ユーザのタッチ方位を検出するとともに、タッチ操作による信号を検出し、信号をタッチ制御器に送信する。タッチ制御器は、タッチ検出装置からタッチ情報を受信し、当該情報を接触点座標に変換し、さらに、プロセッサ840に送信するとともに、プロセッサ840からの命令を受信して実行する。入力ユニット810は、タッチセンシティブ表面811に加えて、他の入力装置812をさらに備えてもよい。好ましくは、その他の入力装置812には、物理キーボード、ファンクションキー(例えば、ボリュームボタン、スイッチボタンなど)、トラックボール、マウス、ジョイスティックなどのうちの1種以上を備えてもよいが、これらに限らない。
オーディオ回路820、スピーカ821、およびマイク822は、ユーザと、コンピュータ機器との間のオーディオインターフェースを提供することができる。オーディオ回路820は、受信されたオーディオデータから変換された電気信号をスピーカ821に転送し、スピーカ821により音声信号に変換して出力する。一方、マイク822は、収集した音声信号を電気信号に変換し、オーディオ回路820が当該電気信号を受信した後でオーディオデータに変換し、オーディオデータをプロセッサ840に転送して処理してから、通信ユニット860を介して例えば他のコンピュータ機器に転送したり、オーディオデータをさらに処理するようにメモリ830に送信したりする。オーディオ回路820は、外部のイヤホンとコンピュータ機器との通信を提供するように、イヤホン挿入口を備えてもよい。
メモリ830は、ソフトウェアプログラムおよびデータを記憶するために構成されてもよく、プロセッサ840は、メモリ830に記憶されたソフトウェアプログラムおよびデータを実行することで、各種の機能のアプリケーションおよびデータ処理を実施する。メモリ830には、主に、プログラム記憶領域とデータ記憶領域とを含有してもよい。その中で、プログラム記憶領域には、OS、少なくとも1つの機能を実行するためのアプリケーション(例えば、音声再生機能、画像再生機能など)などが記憶されてもよい。データ記憶領域には、コンピュータ機器の使用で作成されたデータ(例えば、オーディオ・データ、電話帳など)などが記憶されてもよい。また、メモリ830は、高速RAMを備えてもよく、さらに、例えば少なくとも1つの磁気ディスクメモリ、フラッシュメモリなどの不揮発性メモリ、または他の揮発性のSSDメモリを備えてもよい。相応に、メモリ830は、プロセッサ840および入力ユニット810がメモリ830にアクセスできるように、メモリ制御器をさらに備えてもよい。
プロセッサ840は、コンピュータ機器の制御センターであり、各種のインタフェースおよび回路を介してコンピュータ機器全体の各部と接続され、メモリ830内に記憶されたソフトウェアプログラムおよび/またはモジュールを実行または作動させるとともに、メモリ830内に記憶されたデータを呼び出すことによって、コンピュータ機器の各種機能の実行およびデータの処理を実現することで、コンピュータ機器全体をコントロールする。
表示ユニット850は、ユーザが入力した情報やユーザに提供する情報、およびコンピュータ機器の各種のグラフィカル・ユーザ・インターフェースを表示するためのものであり、これらのグラフィカル・ユーザ・インターフェースは、図形、テキスト、アイコン、ビデオ、およびそれらの任意の組合せで構成されてもよい。表示ユニット850は、表示パネルを備えてもよい。必要に応じて、表示パネルは、LCD(Liquid Crystal Display:液晶ディスプレイ)、OLED(Organic Light−Emitting Diode:有機発光ダイオード)等の形態で構成されてもよい。図に示すように、入力ユニット810と表示ユニット850とが2つの独立した部品として入力および出力の機能を実現するように構成されているが、いくつかの実施例において、入力ユニット810と表示ユニット850とを集積して入力および出力の機能を実現するように構成されてもよい。
通信ユニット860は、情報の送受信または通話の過程において信号の受信・送信をするために構成されている。当該通信ユニット860は、RF(Radio Frequency:無線周波数)回路、ルータ、モデムなどのネットワーク通信機器であってもよい。また、通信ユニット860は、さらに、無線通信により、ネットワーク、および他の機器と通信してもよい。無線通信として、GSM(Global System of Mobile communication)、GPRS(General Packet Radio Service)、CDMA(Code Division Multiple Access、符号分割多重接続)、WCDMA(Wideband Code Division Multiple Access)、LTE(Long Term Evolution)、電子メール、SMS(Short Messaging Service)などを含む任意の通信規格またはプロトコルを利用してもよいが、これらに限らない。
コンピュータ機器は、さらに、各部に電力を供給する電源870(例えば、バッテリー)を備え、好ましくは、電源は、電源管理システムを介してプロセッサ840にロジック的に接続されることにより、電源管理システムを介して充電・放電管理、および消費電力管理などの機能を実現することができる。電源870は、さらに、1つ以上の直流または交流電源、再充電システム、電源故障検出回路、電源コンバータまたはインバータ、電源状態インジケータ等の任意のアセンブリを含んでもよい。
コンピュータ機器は、図示されていないが、カメラ、ブルートゥースモジュール、センサ(例えば、光センサ、運動センサ、およびその他のセンサなど)、オーディオ回路、および無線通信ユニットなどをさらに含んでもよいが、ここで具体的な説明は省略する。
本実施例において、コンピュータ機器は、1つ以上のプロセッサ840、メモリ830、および1つ以上のプログラムを備え、1つ以上のプログラムは、メモリ830に記憶され、且つ1つ以上のプロセッサ840により、1つ以上のプログラムに含まれた対話処理方法を実行するための命令が実行されるように構成され、前記命令は、タスクに関連付けられたユーザ要求データを取得し、前記ユーザ要求データと、予め設定た、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新し、前記対話状態に基づいて少なくとも1つの候補動作データを生成し、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成する命令である。
また、前記ユーザ要求データは、ユーザ要求テキストデータに対して自然言語分析を行って得られた分析結果を含む。
さらに、前記の前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するステップにおいては、前記分析結果が、対話の初回インタラクションを表わす場合、前記分析結果に基づいて、前記タスクに関連付けられた予め設定のタスクパラメータを取得し、前記予め設定た、前記タスクに関連付けられたタスクパラメータ、および場面事前情報に基いて対話パラメータを生成し、前記分析結果に基づいて前記対話パラメータを更新するステップを含む。
また、複数のスロットにより前記タスクに関連付けられた前記タスクパラメータの状態を示し、事前場面情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルに示す。
さらに、前記の前記対話状態に基づいて少なくとも1つの候補動作データを生成するステップにおいては、予め設定された検査条件に基づいて前記対話パラメータに状態検査を行って、前記状態検査の結果に基づいて前記少なくとも1つの候補動作データを生成するステップを含む。
また、前記予め設定された検査条件は、スロットデフォルト値検査条件、パラメータ間のプロパティ依存検査条件、パラメータ間のプロパティトリガ検査条件、パラメータ値確認検査条件、およびパラメータ明確化条件を含む。
さらに、メモリ830において、下記処理の命令を実行することを含む。前記命令は、前記ユーザの対話状態および決定のルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択し、且つ、前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成するステップにおいては、前記好適な候補動作データに基づいて応答テキストデータを生成するステップを含む。
また、前記決定ルールは、予め設定された動作優先順位、および予め設定された動作決定のモデルの1つであり、その中で、前記の前記少なくとも1つの候補動作データから好適な動作データを選択するステップにおいては、前記動作決定モデルに基づいて各前記候補動作データに対応した特徴関数値をそれぞれ取得し、前記特徴関数値における最大値に対応した候補動作データを選択して前記好適な動作データとするステップを含む。
また、前記好適な候補動作データに基づいて応答テキストデータを生成するステップにおいては、更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから、応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップを含む。
また、前記の前記好適な候補動作データに基づいて応答テキストデータを生成するステップにおいては、前記好適な動作データに必要なパラメータデータがデフォルト値をである場合、相応のデフォルト値で前記パラメータデータを充填するステップをさらに含む。
また、前記分析結果に基づいて前記対話パラメータを更新するステップにおいては、更新しようとする対話パラメータの値に対して、それぞれデータ衝突を検出し、データ衝突が検出された場合、更新された対話パラメータの値を消去し、または、更新しようとする対話パラメータの値が正確であるか否かを確認するためのメッセージを送信するステップをさらに含む。
また、前記データ衝突は、対話パラメータの値域を超えた衝突、対話パラメータ間の発生する従属関係衝突、および対話パラメータ間の発生するパラメータ値比較関係衝突のうちの少なくとも1つの衝突を含む。
また、前記分析結果に基づいて前記対話パラメータを更新するステップにおいては、更新しようとする対話パラメータの値に対して、それぞれパラメータ値を推定し、且つ、推定された値により前記対話パラメータを更新するステップをさらに含む。
また、前記取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップにおいては、取得されたパラメータデータに対して、それぞれデータ衝突を検出し、データ衝突が検出された場合、データ衝突が検出されたパラメータデータを捨てるステップをさらに含む。
また、前記取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップにおいては、取得されたパラメータデータに対して、それぞれパラメータ値を推定し、且つ、推定された値および前記好適な動作データにより前記応答テキストデータを生成するステップをさらに含む。
上記のように、図面を参照しながら、本発明の実施例に係るコンピュータ機器の設定およびカスタマイズ、本発明の実施例に係る対話処理方法、対話管理システム、およびコンピュータ機器に対する詳細な説明からわかるように、本発明に係る対話処理方法、対話管理システム、およびコンピュータ機器は、対話システムにおいて具体的なタスク係る対話サービスをカスタマイズすることができ、且つ対話管理システムにより、カスタマイズの対話サービスに対して対話のインタラクティブな処理をすることができ、したがって、新たなタスクの対話サービスが導入された場合、対話サービスを再開発する必要がなく、対話状態パラメータおよび処理ルールを設定する必要があるだけで、前記対話管理システムの拡張性を大幅に向上させ、且つ、開発や配置のコストを節約した。
実施の必要に応じて、本発明に記載の各ステップを、より多くのステップに分割してもよく、2つ以上のステップまたはステップの一部の操作を新規なステップに組み合わせて本発明の目的を実現してもよいと、留意すべきである。
前記本発明に係る方法は、ハードウェア、ファームウェアにおいて実現されることができ、あるいは、記録媒体(例えば、CD ROM、RAM、フロッピーディスク、ハードディスク、または光磁気ディスク)に記憶されることができるソフトウェア、もしくはコンピュータコードとして実現され、あるいは、元にリモート記録媒体や非一時的機械可読媒体に記憶され、ネットワークによりダウンロードされた、且つローカル記録媒体に記憶されるコンピュータコードとして実現され、したがって、ここで記載の方法は、汎用コンピュータ、専用プロセッサまたはプログラム可能なもしくは専用なハードウェア(例えば、ASICまたはFPGA)が用いられる記録媒体に記憶されたソフトウェアにより処理されることができる。コンピュータ、プロセッサ、マイクロプロセッサ制御器、またはプログラム可能なハードウェアは、ソフトウェアまたはコンピュータコードを記憶もしくは受信可能な記憶アセンブリ(例えば、RAM、ROM、フラッシュメモリなど)を含んでおり、前記ソフトウェア、またはコンピュータコードは、コンピュータ、プロセッサ、またはハードウェアでアクセスされて実行される場合、ここで記載の処理方法を実現する。また、汎用コンピュータが、ここで示された処理を実現するためのコードをアクセスした場合、コードの実行は、汎用コンピュータを、ここで示された処理を実行するための専用コンピュータに変換させる。
以上で説明したのは、本発明の具体的な実施形態だけであり、本発明の保護範囲は、これらに限定されるものではない。いかなる当業者が本発明に開示された技術範囲内に容易に想到できる変更または置換の全ては、本発明の保護範囲内に入るべきである。従って、本発明の保護範囲は、添付される特許請求の範囲を基準としているものである。

Claims (25)

  1. タスクに関連付けられたユーザ要求データを取得するステップと、
    前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するステップと、
    前記対話状態に基づいて少なくとも1つの候補動作データを生成するステップと、
    前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成するステップとを含むこと
    を特徴とする対話処理方法。
  2. 前記ユーザ要求データは、ユーザ要求テキストデータに対して自然言語分析を行って得られた分析結果を含むことを特徴とする、請求項1に記載の方法。
  3. 前記の前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するステップにおいては、
    前記分析結果が、対話の初回インタラクションを表わす場合、前記分析結果に基づいて、予め設定された、前記タスクに関連付けられたタスクパラメータを取得し、前記予め設定された、前記タスクに関連付けられたタスクパラメータ、および場面事前情報に基いて対話パラメータを生成ステップと、
    前記分析結果に基づいて前記対話パラメータを更新するステップを含むこと
    を特徴とする請求項2に記載の方法。
  4. 複数のスロットにより前記タスクに関連付けられた前記タスクパラメータの状態を示し、場面事前情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルに示すこと
    を特徴とする請求項3に記載の方法。
  5. 前記の前記対話状態に基づいて少なくとも1つの候補動作データを生成するステップにおいては、
    予め設定された検査条件に基づいて前記対話パラメータを状態検査を行うステップと、
    前記状態検査の結果に基づいて前記少なくとも1つの候補動作データを生成するステップを含むこと
    を特徴とする請求項3または4に記載の方法。
  6. 前記予め設定された検査条件は、スロットデフォルト値検査条件、パラメータ間のプロパティ依存検査条件、パラメータ間のプロパティトリガ検査条件、パラメータ値確認検査条件、およびパラメータ明確化条件を含むこと
    を特徴とする請求項5に記載の方法。
  7. 前記ユーザの対話状態および決定ルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択するステップをさらに含んでおり、
    且つ、前記の前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成するステップにおいては、
    前記好適な候補動作データに基づいて応答テキストデータを生成するステップを含むこと
    を特徴とする、請求項3〜6のいずれか1項に記載の方法。
  8. 前記決定ルールは、予め設定された動作優先順位、および予め設定された動作決定のモデルの1つであり、
    その中で、前記の前記少なくとも1つの候補動作データから好適な動作データを選択するステップにおいては、前記動作決定モデルに基づいて各前記候補動作データに対応した特徴関数値をそれぞれ取得し、前記特徴関数値における最大値に対応した候補動作データを選択して前記好適な動作データとするステップを含むこと
    を特徴とする請求項7に記載の方法。
  9. 前記の前記好適な候補動作データに基づいて応答テキストデータを生成するステップにおいては、
    更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから、応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップを含むこと
    を特徴とする請求項7または8に記載の方法。
  10. 前記の前記好適な候補動作データに基づいて応答テキストデータを生成するステップにおいては、
    前記好適な動作データに必要なパラメータデータがデフォルト値である場合、相応のデフォルト値で前記パラメータデータを充填するステップをさらに含むこと
    を特徴とする請求項9に記載の方法。
  11. 前記の前記分析結果に基づいて前記対話パラメータを更新するステップにおいては、
    更新しようとする対話パラメータの値に対して、それぞれデータ衝突を検出し、データ衝突が検出された場合、更新された対話パラメータの値を消去し、または、更新しようとする対話パラメータの値が正確であるか否かを確認するためのメッセージを送信するステップをさらに含むこと
    を特徴とする請求項3〜10のいずれか1項に記載の方法。
  12. 前記データ衝突は、対話パラメータの値域を超えた衝突、対話パラメータ間で発生する従属関係衝突、および対話パラメータ間で発生するパラメータ値比較関係衝突のうちの少なくとも1つの衝突を含むこと
    を特徴とする請求項11に記載の方法。
  13. 前記の前記分析結果に基づいて前記対話パラメータを更新するステップにおいては、
    更新しようとする対話パラメータの値に対して、それぞれパラメータ値を推定し、且つ、推定された値により前記対話パラメータを更新するステップをさらに含むこと
    を特徴とする請求項3〜12のいずれか1項に記載の方法。
  14. 前記の前記取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップにおいては、
    取得されたパラメータデータに対して、それぞれデータ衝突を検出し、データ衝突が検出された場合、データ衝突が検出されたパラメータデータを捨てるステップをさらに含むこと
    を特徴とする請求項9〜13のいずれか1項に記載の方法。
  15. 前記の前記取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するステップにおいては、
    取得されたパラメータデータに対して、それぞれパラメータ値を推定し、且つ、推定された値および前記好適な動作データにより前記応答テキストデータを生成するステップをさらに含むこと
    を特徴とする請求項9〜14のいずれか1項に記載の方法。
  16. タスクに関連付けられたユーザ要求データを取得するための要求取得装置と、
    前記要求取得装置で取得されたユーザ要求データと、予め設定された前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新するための対話状態更新装置と、
    前記対話状態更新装置で更新された対話状態に基づいて少なくとも1つの候補動作データを生成するための動作生成装置と、
    前記動作生成装置で生成された少なくとも1つの候補動作データに基づいて応答テキストデータを生成するためのテキスト生成装置とを備えること
    を特徴とする対話管理システム。
  17. 前記ユーザ要求データは、ユーザ要求テキストデータに対して自然言語分析を行って得られた分析結果を含むこと
    を特徴とする請求項16に記載のシステム。
  18. 前記分析結果が、対話の初回インタラクションを表わす場合、前記対話状態更新装置は、前記分析結果に基いて、予め設定された前記タスクに関連付けられたタスクパラメータを取得し、予め設定された、前記タスクに関連付けられたタスクパラメータと場面事前情報に基いて対話パラメータを生成するために構成されており、且つ、
    前記対話状態更新装置は、前記分析結果に基づいて前記対話パラメータを更新するために構成されること
    を特徴とする請求項17に記載のシステム。
  19. 前記対話状態更新装置は、さらに、複数のスロットにより前記タスクに前記予め設定た、関連付けられたタスクパラメータの状態を示し、且つ、場面事前情報に基づいて生成された対話パラメータを、それぞれ特徴ベクトルに示すために構成されること
    を特徴とする請求項18に記載のシステム。
  20. 前記動作生成装置は、予め設定された検査条件に基づいて前記対話パラメータを状態検査を行って、且つ、前記状態検査の結果に基づいて前記少なくとも1つの候補動作データを生成するために構成されること
    を特徴とする請求項18または19に記載のシステム。
  21. 前記予め設定された検査条件は、スロットデフォルト値検査条件、パラメータ間のプロパティ依存検査条件、パラメータ間のプロパティトリガ検査条件、パラメータ値確認検査条件、およびパラメータ明確化条件を含むこと
    を特徴とする請求項20に記載のシステム。
  22. 前記システムは、動作決定装置をさらに備えており、
    前記動作決定装置は、前記ユーザの対話状態および決定ルールに基づいて、前記少なくとも1つの候補動作データから好適な動作データを選択するために構成され、且つ、
    前記テキスト生成装置は、前記好適な動作データに基づいて応答テキストデータを生成するために構成されること
    を特徴とする請求項18〜21のいずれか1項に記載のシステム。
  23. 前記決定ルールは、予め設定された動作優先順位、および予め設定された動作決定のモデルの1つであり、
    その中で、前記動作決定装置は、前記動作決定モデルに基づいて各前記候補動作データに対応した特徴関数値をそれぞれ取得し、前記特徴関数値における最大値に対応した候補動作データを選択して前記好適な動作データとするために構成されること
    を特徴とする、請求項22に記載のシステム。
  24. 前記テキスト生成装置は、更新された対話パラメータおよび前記好適な動作データに基づいて、データソースから、応答に必要なパラメータデータを取得し、且つ、取得されたパラメータデータおよび前記好適な動作データに基づいて前記応答テキストデータを生成するために構成されること
    を特徴とする請求項22または23に記載のシステム。
  25. 1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを備えており、
    前記1つ以上のプログラムは、前記メモリに記憶され、且つ、前記1つ以上のプロセッサにより、前記1つ以上のプログラムに含まれた、前記対話処理方法を実行するための命令が実行されるように構成され、
    前記命令は、
    タスクに関連付けられたユーザ要求データを取得し、
    前記ユーザ要求データと、予め設定された、前記タスクに関連付けられたタスクパラメータに基づいて、ユーザの対話状態を更新し、
    前記対話状態に基づいて少なくとも1つの候補動作データを生成し、
    前記少なくとも1つの候補動作データに基づいて応答テキストデータを生成する命令であること
    を特徴とするコンピュータ機器。
JP2016552493A 2014-10-29 2015-10-21 対話処理方法、対話管理システム、およびコンピュータ機器 Active JP6514711B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410593684.0 2014-10-29
CN201410593684.0A CN104360897B (zh) 2014-10-29 2014-10-29 对话处理方法和对话管理***
PCT/CN2015/092464 WO2016066035A1 (zh) 2014-10-29 2015-10-21 对话处理方法、对话管理***和计算机设备

Publications (2)

Publication Number Publication Date
JP2017517776A true JP2017517776A (ja) 2017-06-29
JP6514711B2 JP6514711B2 (ja) 2019-05-15

Family

ID=52528161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016552493A Active JP6514711B2 (ja) 2014-10-29 2015-10-21 対話処理方法、対話管理システム、およびコンピュータ機器

Country Status (6)

Country Link
US (1) US10162814B2 (ja)
EP (1) EP3096226B1 (ja)
JP (1) JP6514711B2 (ja)
KR (1) KR101895251B1 (ja)
CN (1) CN104360897B (ja)
WO (1) WO2016066035A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104360897B (zh) * 2014-10-29 2017-09-22 百度在线网络技术(北京)有限公司 对话处理方法和对话管理***
US10431214B2 (en) * 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US9607616B2 (en) * 2015-08-17 2017-03-28 Mitsubishi Electric Research Laboratories, Inc. Method for using a multi-scale recurrent neural network with pretraining for spoken language understanding tasks
JP6960914B2 (ja) * 2015-10-21 2021-11-05 グーグル エルエルシーGoogle LLC ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成
US10417346B2 (en) * 2016-01-23 2019-09-17 Microsoft Technology Licensing, Llc Tool for facilitating the development of new language understanding scenarios
US9691384B1 (en) * 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
EP3312722A1 (en) 2016-10-21 2018-04-25 Fujitsu Limited Data processing apparatus, method, and program
CN107169034B (zh) * 2017-04-19 2020-08-04 畅捷通信息技术股份有限公司 一种多轮人机交互的方法及***
CN109086282A (zh) * 2017-06-14 2018-12-25 杭州方得智能科技有限公司 一种具备多任务驱动能力的多轮对话的方法和***
CN117195861A (zh) 2017-10-12 2023-12-08 谷歌有限责任公司 确定自动化助理对话的状态
KR102485253B1 (ko) 2017-11-10 2023-01-06 현대자동차주식회사 대화 시스템 및 그 제어방법
JP6856498B2 (ja) * 2017-11-15 2021-04-07 株式会社東芝 支援システム、支援方法、プログラム、及び記憶媒体
US11127057B2 (en) 2017-12-08 2021-09-21 Exalt Solutions, Inc. Intelligent multimedia e-catalog
CN107943793A (zh) * 2018-01-10 2018-04-20 威盛电子股份有限公司 自然语言的语义解析方法
CN110309275B (zh) * 2018-03-15 2024-06-14 北京京东尚科信息技术有限公司 一种对话生成的方法和装置
CN108494861A (zh) * 2018-03-28 2018-09-04 北京三快在线科技有限公司 用于服务资源调配的方法、装置及电子设备
CN109543010A (zh) * 2018-10-22 2019-03-29 拓科(武汉)智能技术股份有限公司 融合数据库查询的人机对话方法及***
CN111261150A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 一种人机对话的实现方法及装置
CN109614468A (zh) * 2018-11-30 2019-04-12 神思电子技术股份有限公司 一种自然语言对话***知识数据调度方法
CN111694932A (zh) * 2019-03-13 2020-09-22 百度在线网络技术(北京)有限公司 对话方法和装置
CN109977208B (zh) * 2019-03-22 2021-04-09 北京中科汇联科技股份有限公司 一种融合faq和任务及主动引导的对话***
CN111813900B (zh) * 2019-04-10 2023-12-08 北京猎户星空科技有限公司 多轮对话处理方法、装置、电子设备及存储介质
CN111831795B (zh) * 2019-04-11 2023-10-27 北京猎户星空科技有限公司 多轮对话处理方法、装置、电子设备及存储介质
US11151333B2 (en) 2019-06-11 2021-10-19 Microsoft Technology Licensing Llc Conversational event modeling
US11170174B2 (en) * 2019-06-11 2021-11-09 Microsoft Technology Licensing, Llc Conversational AI using adaptive dialogs
CN110348916B (zh) * 2019-07-19 2020-11-03 河北冀联人力资源服务集团有限公司 用户留存度计算方法及装置
CN112291293B (zh) * 2019-07-27 2023-01-06 华为技术有限公司 任务处理方法、相关设备及计算机存储介质
CN110516786A (zh) * 2019-08-28 2019-11-29 出门问问(武汉)信息科技有限公司 一种对话管理方法和装置
CN111341308B (zh) * 2020-02-12 2023-07-21 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN111612482A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 对话管理方法、装置和设备
CN112164402B (zh) * 2020-09-18 2022-07-12 广州小鹏汽车科技有限公司 车辆语音交互方法、装置、服务器和计算机可读存储介质
CN112164401B (zh) * 2020-09-18 2022-03-18 广州小鹏汽车科技有限公司 语音交互方法、服务器和计算机可读存储介质
CN112164400A (zh) * 2020-09-18 2021-01-01 广州小鹏汽车科技有限公司 语音交互方法、服务器和计算机可读存储介质
US11663421B2 (en) * 2021-04-27 2023-05-30 Jpmorgan Chase Bank, N.A. Systems and methods for intent-based natural language processing

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232297A (ja) * 1998-02-18 1999-08-27 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法,情報検索装置および情報検索プログラムを格納した記憶媒体
JP2002023783A (ja) * 2000-07-13 2002-01-25 Fujitsu Ltd 対話処理システム
JP2002099404A (ja) * 2000-07-21 2002-04-05 Matsushita Electric Ind Co Ltd 対話制御方法及びその装置
JP2002351492A (ja) * 2001-05-25 2002-12-06 Mitsubishi Electric Corp 対話管理装置
JP2005352761A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法、音声対話装置、音声対話プログラム、これを記録した記録媒体
JP2006039484A (ja) * 2004-07-30 2006-02-09 Nippon Telegr & Teleph Corp <Ntt> 対話理解結果の信頼度算出処理方法
JP2006171399A (ja) * 2004-12-16 2006-06-29 Matsushita Electric Ind Co Ltd データ入力装置
JP2008506156A (ja) * 2004-07-06 2008-02-28 ボクシィファイ, インコーポレイテッド マルチスロット対話システムおよび方法
JP2008090545A (ja) * 2006-09-29 2008-04-17 Toshiba Corp 音声対話装置および音声対話方法
JP2008146150A (ja) * 2006-12-06 2008-06-26 Honda Motor Co Ltd 言語理解装置、言語理解方法、及び、コンピュータプログラム
JP2009140477A (ja) * 2007-10-15 2009-06-25 Nec (China) Co Ltd サービス提案装置及びその方法、サービス提案システム、ユーザのお気に入りベースに基づくサービス提案装置及びその方法
JP2009528621A (ja) * 2006-02-28 2009-08-06 マイクロソフト コーポレーション 適応的セマンティックプラットフォームアーキテクチャ
JP2014002737A (ja) * 2012-06-15 2014-01-09 Samsung Electronics Co Ltd サーバ及びサーバの制御方法
JP2014106927A (ja) * 2012-11-29 2014-06-09 Toyota Motor Corp 情報処理システム
WO2014159472A2 (en) * 2013-03-14 2014-10-02 Apple Inc. Context-sensitive handling of interruptions

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659766A (en) * 1994-09-16 1997-08-19 Xerox Corporation Method and apparatus for inferring the topical content of a document based upon its lexical content without supervision
US5778362A (en) * 1996-06-21 1998-07-07 Kdl Technologies Limted Method and system for revealing information structures in collections of data items
US5970449A (en) * 1997-04-03 1999-10-19 Microsoft Corporation Text normalization using a context-free grammar
JP2002523828A (ja) * 1998-08-24 2002-07-30 ビーシーエル コンピューターズ, インコーポレイテッド 適応型自然言語インターフェース
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6246981B1 (en) * 1998-11-25 2001-06-12 International Business Machines Corporation Natural language task-oriented dialog manager and method
US6233561B1 (en) * 1999-04-12 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method for goal-oriented speech translation in hand-held devices using meaning extraction and dialogue
US7016827B1 (en) * 1999-09-03 2006-03-21 International Business Machines Corporation Method and system for ensuring robustness in natural language understanding
US6549221B1 (en) * 1999-12-09 2003-04-15 International Business Machines Corp. User interface management through branch isolation
US6598018B1 (en) * 1999-12-15 2003-07-22 Matsushita Electric Industrial Co., Ltd. Method for natural dialog interface to car devices
US6727914B1 (en) * 1999-12-17 2004-04-27 Koninklijke Philips Electronics N.V. Method and apparatus for recommending television programming using decision trees
US20040148170A1 (en) * 2003-01-23 2004-07-29 Alejandro Acero Statistical classifiers for spoken language understanding and command/control scenarios
CN1219266C (zh) * 2003-05-23 2005-09-14 郑方 一种实现多路对话的人-机汉语口语对话***的方法
JP2005181386A (ja) 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
WO2007088877A1 (ja) * 2006-01-31 2007-08-09 Honda Motor Co., Ltd. 会話システムおよび会話ソフトウェア
US8108204B2 (en) * 2006-06-16 2012-01-31 Evgeniy Gabrilovich Text categorization using external knowledge
US8175248B2 (en) * 2007-01-29 2012-05-08 Nuance Communications, Inc. Method and an apparatus to disambiguate requests
JP2008233678A (ja) * 2007-03-22 2008-10-02 Honda Motor Co Ltd 音声対話装置、音声対話方法、及び音声対話用プログラム
CN101398810B (zh) 2007-09-30 2013-05-01 日电(中国)有限公司 自适应服务选择设备及其方法,查询***及其方法
US8140335B2 (en) * 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US20110191748A1 (en) * 2010-01-29 2011-08-04 International Business Machines Corporation Systems and methods for design time service verification and validation
US8707198B2 (en) * 2010-06-04 2014-04-22 Microsoft Corporation Related tasks and tasklets for search
WO2012121728A1 (en) * 2011-03-10 2012-09-13 Textwise Llc Method and system for unified information representation and applications thereof
EP2575128A3 (en) 2011-09-30 2013-08-14 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
CN102760076B (zh) * 2012-06-05 2015-01-21 华为技术有限公司 一种***的策略冲突处理方法及策略冲突处理***
US8457950B1 (en) * 2012-11-01 2013-06-04 Digital Reasoning Systems, Inc. System and method for coreference resolution
KR101709187B1 (ko) * 2012-11-14 2017-02-23 한국전자통신연구원 계층적 대화 태스크 라이브러리를 이용한 이중 대화관리 기반 음성대화시스템
US9202459B2 (en) * 2013-04-19 2015-12-01 GM Global Technology Operations LLC Methods and systems for managing dialog of speech systems
US9589565B2 (en) * 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
US9772994B2 (en) * 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
US10073840B2 (en) * 2013-12-20 2018-09-11 Microsoft Technology Licensing, Llc Unsupervised relation detection model training
US9378740B1 (en) * 2014-09-30 2016-06-28 Amazon Technologies, Inc. Command suggestions during automatic speech recognition
CN104360897B (zh) * 2014-10-29 2017-09-22 百度在线网络技术(北京)有限公司 对话处理方法和对话管理***

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232297A (ja) * 1998-02-18 1999-08-27 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法,情報検索装置および情報検索プログラムを格納した記憶媒体
JP2002023783A (ja) * 2000-07-13 2002-01-25 Fujitsu Ltd 対話処理システム
JP2002099404A (ja) * 2000-07-21 2002-04-05 Matsushita Electric Ind Co Ltd 対話制御方法及びその装置
JP2002351492A (ja) * 2001-05-25 2002-12-06 Mitsubishi Electric Corp 対話管理装置
JP2005352761A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 音声対話方法、音声対話装置、音声対話プログラム、これを記録した記録媒体
JP2008506156A (ja) * 2004-07-06 2008-02-28 ボクシィファイ, インコーポレイテッド マルチスロット対話システムおよび方法
JP2006039484A (ja) * 2004-07-30 2006-02-09 Nippon Telegr & Teleph Corp <Ntt> 対話理解結果の信頼度算出処理方法
JP2006171399A (ja) * 2004-12-16 2006-06-29 Matsushita Electric Ind Co Ltd データ入力装置
JP2009528621A (ja) * 2006-02-28 2009-08-06 マイクロソフト コーポレーション 適応的セマンティックプラットフォームアーキテクチャ
JP2008090545A (ja) * 2006-09-29 2008-04-17 Toshiba Corp 音声対話装置および音声対話方法
JP2008146150A (ja) * 2006-12-06 2008-06-26 Honda Motor Co Ltd 言語理解装置、言語理解方法、及び、コンピュータプログラム
JP2009140477A (ja) * 2007-10-15 2009-06-25 Nec (China) Co Ltd サービス提案装置及びその方法、サービス提案システム、ユーザのお気に入りベースに基づくサービス提案装置及びその方法
JP2014002737A (ja) * 2012-06-15 2014-01-09 Samsung Electronics Co Ltd サーバ及びサーバの制御方法
JP2014106927A (ja) * 2012-11-29 2014-06-09 Toyota Motor Corp 情報処理システム
WO2014159472A2 (en) * 2013-03-14 2014-10-02 Apple Inc. Context-sensitive handling of interruptions

Also Published As

Publication number Publication date
CN104360897A (zh) 2015-02-18
CN104360897B (zh) 2017-09-22
KR20160124766A (ko) 2016-10-28
US20170242843A1 (en) 2017-08-24
JP6514711B2 (ja) 2019-05-15
EP3096226A4 (en) 2017-11-15
WO2016066035A1 (zh) 2016-05-06
EP3096226B1 (en) 2020-03-04
EP3096226A1 (en) 2016-11-23
KR101895251B1 (ko) 2018-09-05
US10162814B2 (en) 2018-12-25

Similar Documents

Publication Publication Date Title
JP6514711B2 (ja) 対話処理方法、対話管理システム、およびコンピュータ機器
US9638528B2 (en) Method and apparatus for displaying geographic location
US11909906B2 (en) Method and apparatus for pushing notification, mobile terminal, and graphical user interface
CN110073385B (zh) 电子邮件***中的文档链接
US11575624B2 (en) Contextual feedback, with expiration indicator, to a natural understanding system in a chat bot
KR20180030105A (ko) 컨텍스트 데이터를 기반으로 하는 어플리케이션 카드들
CN109219953B (zh) 一种闹钟提醒方法、电子设备及计算机可读存储介质
US20200380076A1 (en) Contextual feedback to a natural understanding system in a chat bot using a knowledge model
US20150026244A1 (en) Communication system, client terminal, and server device
CN112749074B (zh) 一种测试用例推荐方法以及装置
CN110347578B (zh) 一种应用的测试方法、装置及存储介质
CN114491269A (zh) 出行服务的推荐方法及装置、设备和介质
CN107930126B (zh) 游戏预约数据处理方法、装置以及移动终端
US11477140B2 (en) Contextual feedback to a natural understanding system in a chat bot
CN112748835A (zh) 终端、服务器、最近任务列表显示方法和应用推荐方法
JP7157868B2 (ja) デバイス管理システム
CN108600303B (zh) 一种应用控制方法、装置、终端设备和介质
CN117456993A (zh) 语音控制方法、装置、电子设备和存储介质
CN116186333A (zh) 用户事件索引方法、装置、电子设备和存储介质
US20180189290A1 (en) Content object indexing and resolution system
CN117014421A (zh) 一种资源预加载方法、装置、电子设备及存储介质
CN115080411A (zh) 一种接口测试用例生成方法、装置、电子设备和存储介质
JP2021114031A (ja) 予約管理装置、及び予約管理システム
CN117556155A (zh) 基于大语言模型的行程规划方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180629

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190304

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190412

R150 Certificate of patent or registration of utility model

Ref document number: 6514711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250