JP2019528512A - 人工知能に基づくヒューマンマシンインタラクション方法及び装置 - Google Patents

人工知能に基づくヒューマンマシンインタラクション方法及び装置 Download PDF

Info

Publication number
JP2019528512A
JP2019528512A JP2019501993A JP2019501993A JP2019528512A JP 2019528512 A JP2019528512 A JP 2019528512A JP 2019501993 A JP2019501993 A JP 2019501993A JP 2019501993 A JP2019501993 A JP 2019501993A JP 2019528512 A JP2019528512 A JP 2019528512A
Authority
JP
Japan
Prior art keywords
question
keyword
answer
human
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019501993A
Other languages
English (en)
Other versions
JP6726800B2 (ja
Inventor
浩 田
浩 田
世奇 ▲趙▼
世奇 ▲趙▼
舟 忻
舟 忻
泉 温
泉 温
文涛 ▲馬▼
文涛 ▲馬▼
▲騰▼ ▲許▼
▲騰▼ ▲許▼
心▲諾▼ ▲許▼
心▲諾▼ ▲許▼
海松 ▲張▼
海松 ▲張▼
湘▲陽▼ 周
湘▲陽▼ 周
睿 ▲嚴▼
睿 ▲嚴▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2019528512A publication Critical patent/JP2019528512A/ja
Application granted granted Critical
Publication of JP6726800B2 publication Critical patent/JP6726800B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

【課題】機器が人間の対話スタイルで人間と対話型インタラクションするようにし、ヒューマンマシンインタラクションが本当の人間同士の対話型インタラクションの効果を有するようにする人工知能に基づくヒューマンマシンインタラクション方法及び装置を提供することである。【解決手段】人工知能に基づくヒューマンマシンインタラクション方法は、ユーザによって入力された質問を受信するステップと、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、前記回答をユーザにフィードバックするステップと、を含む。当該方法は、ヒューマンマシンインタラクションが、本当の人間同士の対話型インタラクションの効果を有するようにすることができる。【選択図】図1

Description

[優先権情報]
本出願は、バイドォウオンラインネットテクノロジー(ベイジン)カンパニーリミテッドが2016年09月05日付に提出した、発明の名称が「人工知能に基づくヒューマンマシンインタラクション方法及び装置」で、中国特許出願番号が「201610803645.8」である特許出願の優先権を主張するものである。
本出願は、人工知能技術分野に関し、特に、人工知能に基づくヒューマンマシンインタラクション方法及び装置に関する。
人工知能(Artificial Intelligence,AI)は、人間の知能を模擬、延伸及び拡張するための理論、方法、技術及び応用システムを研究して開発する新しい技術科学である。人工知能は、コンピュータサイエンスの一つの分岐であり、知能の本質を理解し、人間知能と同様な方式で反応可能な新たな知能機器を生み出すことを意図し、当該分野の研究は、知能食事注文ロボット、言語認識、画像認識、自然言語処理、及びエキスパートシステムなどを含む。
人工知能などの技術の発展に伴い、ヒューマンマシンインタラクションシステムは、既に様々な形で人々の生活に現れている。例えば、自然対話分野において、機器が人間と対話することができ、知能顧客サービス分野において、顧客サービスシステムが人間にサービスを提供することができる。しかし、従来のヒューマンマシンインタラクションシステムのプロセスは、通常、機器が人間の質問(query)を受信した後、データベースで関連する回答(reply)をルックアップしてユーザに提示する。このような方式は、本質上検索であり、人間同士の対話時の論理を有せず、本当の人間同士の対話型インタラクションの効果を実現することができない。
本出願は、関連技術における少なくとも一つの技術的課題をある程度で解決することを目的とする。
そのため、本出願の一つの目的は、機器が人間の対話スタイルで人間と対話型インタラクションするようにし、ヒューマンマシンインタラクションが本当の人間同士の対話型インタラクションの効果を有するようにする人工知能に基づくヒューマンマシンインタラクション方法を提供することである。
本出願のもう一つの目的は、人工知能に基づくヒューマンマシンインタラクション装置を提供することである。
上記目的を達成するために、本出願の第1側面の実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法は、ユーザによって入力された質問を受信するステップと、人間対話コーパスに基づい予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、前記回答をユーザにフィードバックするステップと、を含む。
本出願の第1側面の実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法は、予め生成されたモデルにより、ユーザによって入力された質問に対応する回答を取得し、当該モデルは、人間対話コーパスに基づいて生成されたものであり、当該回答は、人間の対話スタイルを有するため、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。
上記目的を達成するために、本出願の第2側面の実施例によって提供される人工知能に基づくヒューマンマシンインタラクション装置は、ユーザによって入力された質問を受信する受信モジュールと、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得する取得モジュールと、前記回答をユーザにフィードバックするフィードバックモジュールと、を含む。
本出願の第2側面の実施例によって提供される人工知能に基づくヒューマンマシンインタラクション装置は、予め生成されたモデルにより、ユーザによって入力された質問に対応する回答を取得し、当該モデルは、人間対話コーパスに基づいて生成されたものであり、当該回答は、人間の対話スタイルを有するため、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。
本出願の実施例は、本出願の第1側面の実施例のいずれかに記載の方法を実行するように構成されるプロセッサと、プロセッサがによって実行可能な命令を記憶するためのメモリと、を含む機器を提供する。
本出願の実施例は、非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記記憶媒体における命令がプロセッサによって実行される場合、プロセッサは、本出願の第1側面の実施例のいずれかに記載の方法を実行可能である。
本出願の実施例は、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品における命令がプロセッサによって実行される場合、プロセッサは、本出願の第1側面の実施例のいずれかに記載の方法を実行可能である。
本出願の付加的な特徴及び利点は、一部が以下の説明において示され、一部が以下の説明により明らかになり、又は本出願の実践により理解される。
本出願の上記及び/又は付加的な特徴及び利点は、実施例について図面を参照して以下に説明することにより、明らかになり、理解されやすくなる。
本出願の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法の概略フローチャートである。 本出願の実施例における訓練プロセスでモデルを生成する概略フローチャートである。 本出願の実施例におけるコーパスソースの概略分類図である。 本出願の実施例における一つの予測モデルの概略図である。 本出願の実施例におけるもう一つの予測モデルの概略図である。 本出願の実施例におけるもう一つの予測モデルの概略図である。 本出願の実施例に対応する全体アーキテクチャ図である。 本出願の他の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法の概略フローチャートである。 本出願の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション装置の概略構成図である。 本出願の他の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション装置の概略構成図である。
以下、本出願の実施例を詳細に説明する。前記実施例における例が図面に示され、同一又は類似する符号は、常に同一又は類似するモジュール、或いは、同一又は類似する機能を有するモジュールを示す。以下に、図面を参照しながら説明される実施例は例示的なものであり、本出願を解釈するためだけに用いられ、本出願を限定するものと理解してはいけない。逆に、本出願の実施例は、添付の特許請求の範囲の趣旨及び内包範囲にに含まれるあらゆる変更、修正及び同等物を含む。
図1は、本出願の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法の概略フローチャートである。
図1に示すように、本実施例は、以下のステップS11と、ステップS12と、ステップS13と、を含む。
ステップS11において、ユーザによって入力された質問(query)を受信する。
ユーザは、テキストや音声、又は画像などの形式で質問を入力することができる。質問がテキスト形式ではない場合、まず、非テキストの形の質問をテキストに変換することができる。具体的に採用される技術は、例えば、音声認識、画像内容認識などの変換技術を含み、これらの変換技術は、従来の、又は将来に現れる技術を採用して実現することができ、ここでは、詳しく説明しない。
ステップS12において、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得する。
訓練段階において上記モデルを生成することができる。訓練段階において、まず、大量の人間対話コーパスを収集し、人間対話コーパスは、セット(pair)を単位とし、各セットは、質問(query)と回答(answer)とを含み、訓練するときに、コーパスにおける質問を入力としてモデルを訓練して、出力をコーパスにおける対応する回答と可能な限り一致させる。当該モデルが、人間対話コーパスに基づいて生成されるため、当該モデルに基づいて現在の質問を処理して取得された出力も、人間の対話スタイルを有する回答となる。
さらに、上記モデルが、具体的に実現する場合、一つとは限らず、複数であってもよく、それぞれ異なる機能を完成して、ユーザによって入力された質問により人間の対話スタイルを有する回答を取得する。
ステップS13において、前記回答をユーザにフィードバックする。
回答を取得した後、回答を音声形式でユーザに再生することができる。
また、取得された回答がテキスト形式である場合、音声合成などの技術によりそれを音声に変換することができる。
本実施例において、予め生成されたモデルにより、ユーザによって入力された質問に対応する回答を取得し、当該モデルは、人間対話コーパスに基づいて生成されたものであり、当該回答は、人間の対話スタイルを有するため、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。
上記実施例は、対話プロセスを説明した。対話プロセスにおいて、モデルが用いられ、当該モデルは、訓練プロセスで生成されたものであってもよく、訓練プロセスでモデルを生成するプロセスについて以下に説明する。
図2は、本出願の実施例における訓練プロセスでモデルを生成する概略フローチャートである。
本実施例において、モデルが、マッピング関係と、予測モデルと、文法モデルと、を含むことを例とする。マッピング関係は、質問中のキーワードと回答中のキーワードとの間のマッピング関係を示す。予測モデルは、コンテキスト情報に基づいて、複数のマッピング関係から最適なマッピング関係を決定し、決定されたマッピング関係におけるキーワードにマッチングするコロケーション単語を生成する。文法モデルは、用語の順序を調整し、調整された用語に基づいて、文法構造に適合する文を生成する。
図2に示すように、本実施例は、以下のステップS21と、ステップS22と、ステップS23と、ステップS24と、を含む。
ステップS21において、人間対話コーパスを収集する。
コーパスの選択は、ビデオ(映画、ドラマ、アニメーションなど)における対話と、文学作品(歴史名作、推理小説、恋愛小説、オンライン小説など)における対話と、ソーシャルプラットフォーム(ウェイボー、掲示板、Doubanなど)における対話と、地方言語(東北方言、北京方言、広東方言など)の対話と、を含む人間と人間との対話のあるあらゆるところに基づくことができる。
図3に示すように、コーパスソースの分類が示されているため、複数のコーパスソースから異なるスタイルのコーパスを収集することができ、同一のコーパスソースは、一つ又は複数の対話スタイルを備えることができる。ビデオにおける対話は、ビデオジャンルの変化に伴って、対話のスタイルが大きく異なり、コメディにおける対話は、一般的に、ユーモラスであり、恋愛映画における対話は、一般的に、愛に満ち溢れ、戦争映画における対話は、一般的に、緊張で激しいなど。文学作品における対話スタイルも、ジャンルによって異なり、歴史名作における対話は、一般的に、ある歴史背景の特色が付いており、推理小説における対話は、論理的に厳密であり、恋愛小説における対話は、感情豊かであるなど。ネットワークソーシャルプラットフォームにおける対話には、多くのネットワーク用語が含まれるが、それ自体が人々の日常対話であるので全体のスタイルが最も人々の日常対話に近く、地方言語対話は、各種の地方方言を含むため、各種の地方特色が付いている。
ステップS22において、人間対話コーパスにおける質問中のキーワード及び対応する回答中のキーワードを抽出し、抽出されたキーワードに基づいて、質問中のキーワードと回答中のキーワードとの間のマッピング関係を生成する。
1セットの人間対話コーパスに対応して、その中の質問(問と略する)及び回答(答と略する)を単語分割して、問における用語(term)及び答における用語を取得し、次に用語の中からキーワード(例えば、出現確率に基づく)を決定し、次に大量のコーパスの学習によりマッピング関係を取得することができる。
例えば、1セットの問答は、以下のとおりである。
問:一日中忙しくて、やっと退勤しました。
答:お疲れさま、今、お帰りですか。
問及び答をそれぞれ単語分割して、その中のキーワードを抽出し、「忙しい」、「退勤」を含む問におけるキーワードと、「疲れ」、「帰り」を含む答におけるキーワードと、を取得することができる。そのため、「忙しい」と「疲れ」との間のマッピング関係、及び「退勤」と「帰り」との間のマッピング関係を確立することができる。
上記マッピング関係は、一対多であってもよく、例えば、もう1セットのコーパスは、以下のとおりである。
問:一日中忙しくて、やっと退勤しました。
答:休憩しましょう。仕事は完成しましたか。
上記処理と同様に、「忙しい」と「休憩」との間のマッピング関係、「退勤」と「仕事」との間のマッピング関係を確立することができる。
そのため、複数のコーパスをまとめて、「忙しい」と「疲れ」、「休憩」との間のマッピング関係、及び「退勤」と「帰り」、「仕事」との間のマッピング関係を確立することができる。
上記マッピング関係を取得した後、キーと値のセット(key、value)の方式で記憶することができる。例えば、キーは、「忙しい」であり、値は、「疲れ」と、「休憩」とを含む。
コーパスは、異なるコーパスソースからのものであってもよく、異なるコーパスソースは、異なるスタイルを有することができるため、異なるスタイルのマッピング関係を形成することができる。
例えば、あるドラマにおける1セットの対話は、下記の問答を含む。
問:僕は、試験のことを考えてるんだ。
答:っていうことは、どうやってカンニングするかって考えてるんだろう。
問:なんでいつも僕を悪く思うの。
答:よく思われたいなら、チャンスをちょうだいね。
上記コーパスに基づいて、例えば、「考える」と「思う」との間のマッピング関係、及び「試験」と「どうやってカンニングするか」との間のマッピング関係のようなユーモラスなスタイルを有する1セットのマッピング関係を確立することができる。
また、例えば、ある恋愛小説における1セットの対話は、下記問答を含む。
問:僕は、試験のことを考えてるんだ。
答:ダーリン、あたしは、あなたのことを考えてるだけどなぁ。
上記コーパスにより、例えば、「僕」と「ダーリン」、「あたし」との間のマッピング関係、「考える」と「考える」との間のマッピング関係、及び「試験」と「あなた」との間のマッピング関係のような、愛が溢れるスタイルを有する1セットのマッピング関係を確立することができる。
また、例えば、普通のソーシャルプラットフォームにおいて、1セットの対話は、下記問答を含む。
問:僕は、試験のことを考えてるんだ。
答:試験の何を考えてるの。
上記コーパスに基づいて、例えば、「考える」と「考える」との間のマッピング関係、及び「試験」と「何」との間のマッピング関係のような、普通の生活スタイルを有する1セットのマッピング関係を確立することができる。
また、例えば、東北方言での1セットの対話は、下記問答を含む。
問:僕は、試験のことを考えてるんだ。
答:何を考えてる(中文:尋思)の。試験になったら、手も足も出ない(中文:麻爪)だろう。
上記コーパスに基づいて、例えば、「考える(中文:想」)と「考える(中文:尋思)」との間のマッピング関係、及び「試験」と「手も足も出ない」との間のマッピング関係のような、東北方言スタイルを有する1セットのマッピング関係を確立することができる。
ステップS23において、人間対話コーパスから質問中のキーワード、回答中のキーワード及びコンテキスト情報を取得し、取得されたキーワード及びコンテキスト情報に基づいて、予測モデルを生成する。
例えば、質問中のキーワードは、「忙しい」と「退勤」とを含み、あるコーパスにおけるコンテキスト情報は、「時間が遅い」、「帰りたい」などであり、対応する回答には、「疲れ」、「帰り」がよく現れ、すると、予測モデルには、図4に示す質問と、コンテキスト情報と、回答との間の対応関係が含まれる。また、例えば、質問中のキーワードは、「忙しい」と「退勤」とを含み、別のコーパスにおけるコンテキスト情報は、「仕事が多い」、「上司が促す」などであり、対応する回答には、「休憩」、「仕事」、「完成」がよく現れ、すると、予測モデルには、図5に示す質問と、コンテキスト情報と、回答との間の対応関係が含まれる。
図4〜図5について、論理上の関係で説明したが、予測モデルにおける上記関係は、論理上のものとは限らず、スタイル的なものであってもよく、例えば、同様な質問「考える」、「試験」に対応して、図6を参照し、異なるスタイルにおいて、異なる回答に対応することができる。
さらに、予測モデルは、質問と、コンテキスト情報と、回答との間の対応関係を示すだけではなく、コロケーションをも学習して、回答中のキーワードに基づいて、それを補足して、文をコロケーションする。例えば、質問と、コンテキスト情報とに基づいて取得された回答は、「ている、考える、カンニング」などのキーワードを含み、そして、ユーモラスな対話コーパスに基づいて、対応するスタイルにおける常用コロケーションである「考えてる、どうやってカンニングするか」を学習することができる。恋愛小説において、同様に「あたし、考える」というキーワードを抽出することができ、そして対応する愛が溢れるコロケーション「ダーリン、あなたのことを考えてる」を学習することができ、最後には、このような愛が溢れるコロケーション方式を学習する。
ステップS24において、人間対話コーパスの文法構造を分析して、文法モデルを生成する。
文法モデルの本質は、一つの言語モデルであり、当該モデルは、コーパスにおける対話に基づいて、人間の会話において常用される文法構造を学習することができ、その主な原理は、コーパスにおける対話セットを前処理された品詞識別子及びシーケンスの順序に基づいて、いくつかの接続詞及び助詞の追加及び補足を含む人間対話における慣用表現方式を学習する。例えば、上記において、「考えてる、どうやってカンニングするか」を学習した後、文法モデルは、この二つのフレーズにより一つの回答を構築する文法構造を学習することにより、「ってことは」のような接続詞を追加することを学習することができた。さらに、例えば、上記において、恋愛小説における対話では、回答から、上記に対応して生成された「ダーリン、あたし、考える、あなた」を抽出した後、文法モデルは、これらの用語から最終回答である「ダーリン、あたしは、あなたのことを考えてるだけどなぁ」までの表現方式を学習することにより、「だけど、なぁ」などの終助詞の使用を学習することができる同時に、このような愛が溢れる表現方式をも学習することができる。訓練段階において、文法モデルは、主にコーパスにおける言語の構造順序及び表現方式を学習する。構造順序の学習は、文の基本的な流暢さを保証し、表現方式の学習も、コーパスのスタイルによって変化する。
上記に示すように、本実施例において、マッピング関係、予測モデル及び文法モデルを生成することができ、その後、これらのモデルは、対話段階で用いられる。
本実施例において、人間対話コーパスを収集することにより、人間対話コーパスに基づいて、モデルを訓練して生成することができ、これにより、機器が、人間の対話スタイルを学習するようになる。モデルが対話プロセスに適用された後、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。
上記対話プロセス及び訓練プロセスを参照して、図7に示すように、全体アーキテクチャ図が示されている。
図7に示すアーキテクチャを参照して、訓練プロセスと対話プロセスとを含むプロセスの全体について以下に説明する。
図8は、本出願のもう一つの実施例によって提供される人工知能に基づくヒューマンマシンインタラクション方法の概略フローチャートである。
図8に示すように、本実施例は、以下のステップS801〜ステップS811を含む。
ステップS801において、人間対話コーパスを収集する。
ステップS802において、人間対話コーパスを前処理する。
前処理は、人間対話コーパスにおける質問及び回答をそれぞれ単語分割して、キーワードを選定し、各キーワードに対応する識別子(id)を決定して、単語シーケンスをidシーケンスに変換するステップを含むことができる。
単語と識別子との間の対応関係を含む辞書を取得することができ、当該辞書に基づいて、単語シーケンスを対応するidシーケンスに変換することができる。
当該ステップは、図7に示す前処理モジュールによって実行することができる。
ステップS803において、前処理された人間対話コーパスに基づいて、質問中のキーワードと回答中のキーワードとの間のマッピング関係を生成し、当該マッピング関係を記憶する。
当該ステップは、図7に示すマッピング学習及び記憶モジュールによって実行することができる。
具体的なマッピング関係の生成プロセスは、上記実施例を参照することができ、ここでは、詳しく説明しない。
なお、訓練段階において上記前処理を行ったため、上記マッピング関係は、id間のマッピング関係であってもよい。
ステップS804において、前処理された人間対話コーパスに基づいて、予測モデルを生成する。
当該ステップは、図7に示す予測モジュールによって実行することができる。
具体的な予測モデルの生成プロセスは、上記実施例を参照することができ、ここでは、詳しく説明しない。
ステップS805において、前処理された人間対話コーパスに基づいて、文法モデルを生成する。
当該ステップは、図7に示す文法学習及び制御モジュールによって実行することができる。
具体的な文法モデルの生成プロセスは、上記実施例を参照することができ、ここでは、詳しく説明しない。
ステップS801〜ステップS805は、訓練段階において実行することができる。
なお、各モジュール間のインタラクションは、図7に示す主制御システムによって実行することができる。
ステップS806において、ユーザによって入力された質問を受信する。
ステップS807において、ユーザによって入力された質問を前処理する。
前処理は、前処理モジュールによって実行することができる。具体的な前処理プロセスは、上記訓練段階の対応するプロセスを参照することができる。
ステップS808において、マッピング関係に基づいて、ユーザによって入力された質問中のキーワードに対応する回答中のキーワードを決定する。
主制御システムは、前処理された質問をマッピング学習及び記憶モジュールに送信することができ、マッピング学習及び記憶モジュールが、自体に記憶されているマッピング関係に基づいて、前処理された質問に対応する回答中のキーワードを決定する。
ステップS809において、予測モデルに基づいて、決定されたキーワードから最適な1セットのキーワードを選択し、選択された1セットのキーワードに基づいてコロケーション単語を生成する。
主制御システムは、マッピング学習及び記憶モジュールから複数のセットのキーワードを取得することができ、その後、主制御システムは、複数のセットのキーワードを予測モジュールに送信し、コンテキスト記憶モジュールによって現在のコンテキスト情報を取得することができ、予測モジュールは、すでに生成された予測モデル及び現在のコンテキスト情報に基づいて、複数のセットのキーワードから1セットのキーワードを選択する。
例えば、マッピング関係に基づいて、複数のセットのキーワードを決定することができる。例えば、質問中のキーワードは、「忙しい」と「退勤」とを含む場合、マッピング関係に基づいて決定されたキーワードは、「休憩、仕事、完成」と、「疲れ、帰り」とを含むことができる。当該ステップにおいて、予測モデル及び現在のコンテキスト情報に基づいて、決定された複数のセットのキーワードから最適な1セットのキーワードを選択することができ、例えば、現在のコンテキスト情報が「仕事が多く、上司が促す」である場合、選択された1セットのキーワードは、「休憩、仕事、完成」であり、又は、現在のコンテキスト情報が「時間が遅く、帰りたい」である場合、選択された1セットのキーワードは、「疲れ、帰り」である。
また、予測モデルは、コンテキスト情報に基づいて、現在のスタイルを決定し、それからスタイルに基づいて、対応するコロケーション単語を決定することができる。例えば、選択された1セットのキーワードが「ている、考える」であり、現在のスタイルがユーモラスである場合、「考えてる、どうやってカンニングするか」のようなコロケーション単語を決定することができ、又は、現在のスタイルが「愛が溢れる」である場合、「ダーリン、あなたのことを考えてる」のようなコロケーション単語を決定することができる。
ステップS810において、文法モデルに基づいて、選択された1セットのキーワード及び生成されたコロケーション単語の文法構造を調整して、文法構造を満たす文を取得する。
主制御システムは、予測モジュールからキーワード及びコロケーション単語を取得して文法学習及び制御モジュールに送信し、文法学習及び制御モジュールは、文法モデルに基づいて、各用語の順序を調整して、文法構造を満たす文を生成することができる。文法学習及び制御モジュールによって採用される文法モデルは、訓練段階で人間対話コーパスに基づいて生成されたものであってもよいし、又は、オープンインターフェースを介して第三者から取得された文法モデルであってもよい。
ステップS811において、文法構造を満たす文を、回答としてユーザにフィードバックする。
例えば、主制御システムは、文法学習及び制御モジュールから文法構造を満たす文を取得した後、当該文の音声合成を行い、出力インターフェースを介してユーザに再生する。
さらに、当該方法は、ユーザとのインタラクティブ対話に基づいて、オンライン学習を行うステップS812をさらに含むことができる。
ユーザと対話する場合、システムは、いくつかの対話のコーパスをリアルタイムで生成することができ、これらのコーパスは、現在のユーザの表現習慣及びスタイルを含んでいるため、一定時間内にユーザと対話したチャット履歴をコーパスとして、ユーザの表現習慣を学習することができる。当該モジュールは、主に対話履歴をコーパスとして定時に収集して、システムの各モジュールをリアルタイムで再訓練し、チャット履歴の使用において、ユーザの毎回の入力が、機器の前回の回答に対する一つの質問であるため、機器の前回のステップで生成された回答を質問とし、且つユーザの入力を回答としする一つ一つのセットとして再訓練し、システムがユーザと対話するプロセスでユーザの対話スタイルを学習することができる。当該モジュールは、一つのプラガブルモジュールであり、当該モジュールが接続される場合、モジュールは、ログにおけるユーザと機器との対話により絶えず学習し、当該モジュールが取り外される場合にも、システムの全体は、正常に動作することができる。
さらに、当該方法は、オープンインターフェースを介して、他のシステムを呼び出し、又は、他のシステムによって呼び出されるステップS813をさらに含むことができる。
図7に示すように、当該システムは、いくつかのオープンインターフェースを提供することもでき、これらのオープンインターフェースは、外部にオープンする呼び出しインターフェース及び拡張インターフェースであり、呼び出しインターフェースは、他のシステムが当該インターフェースを介して本システムを直接呼び出せるようにすることができ、拡張インターフェースは、他の関連モデル又はシステムにアクセスして機能強化を行うことができ、例えば、文法学習モジュールは、他のいくつかの熟成した言語モデルを呼び出して、システムにおける文法学習及び調整の機能を強化することができる。
本実施例において、人間対話コーパスを収集することにより、人間対話コーパスに基づいて、モデルを訓練して生成することができ、機器が、人間の対話スタイルを学習するようになる。モデルを対話プロセスに適用した後、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。さらに、ヒューマンマシンインタラクションの効果を向上させるために、オンライン学習により、新しいデータをリアルタイムで学習することができる。さらに、オープンインターフェースにを介して、他のシステムによって呼び出され、又は、他のシステムを呼び出すことができ、ヒューマンマシンインタラクションサービスをよりよく提供する。
図9は、本出願の一実施例によって提供される人工知能に基づくヒューマンマシンインタラクション装置の概略構成図である。
図9に示すように、当該装置90は、受信モジュール91と、取得モジュール92と、フィードバックモジュール93とを含む。
受信モジュール91は、ユーザによって入力された質問を受信する。
取得モジュール92は、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得する。
フィードバックモジュール93は、前記回答をユーザにフィードバックする。
一部の実施例において、前記モデルは、質問中のキーワードと回答中のキーワードとの間のマッピング関係を示すマッピング関係と、コンテキスト情報に基づいて、複数のマッピング関係から最適なマッピング関係を決定し、決定されたマッピング関係におけるキーワードにマッチングするコロケーション単語を生成する予測モデルと、用語の順序を調整し、調整された用語に基づいて、文法構造に適合する文を生成する文法モデルと、を含む。
一部の実施例において、図10を参照し、前記取得モジュール92は、
前記マッピング関係に基づいて、ユーザによって入力された質問中のキーワードに対応する回答中のキーワードを決定するマッピングサブモジュール921と、
前記予測モデルに基づいて、決定されたキーワードから最適な1セットのキーワードを選択し、選択された1セットのキーワードに基づいて、コロケーション単語を生成する予測サブモジュール922と、
前記文法モデルに基づいて、前記選択された1セットのキーワード及び生成されたコロケーション単語の文法構造を調整し、人間の対話スタイルを有する回答として文法構造を満たす文を取得する文法分析サブモジュール923と、を含む。
一部の実施例において、前記マッピングサブモジュールは、さらに、人間対話コーパスにおける質問中のキーワード、及び対応する回答中のキーワードを抽出し、抽出されたキーワードに基づいて、前記マッピング関係を生成し、又は、
一部の実施例において、前記予測サブモジュールは、さらに、人間対話コーパスにおける質問中のキーワード、及び対応する回答中のキーワードを抽出し、対応するコンテキスト情報を抽出して、抽出されたキーワード及びコンテキスト情報に基づいて、前記予測モデルを生成し、又は、
一部の実施例において、前記文法分析サブモジュールは、さらに、人間対話コーパスに基づいて、前記文法モデルを生成し、又は、オープンインターフェースを介して他のシステムから前記文法モデルを取得する。
一部の実施例において、図10を参照し、当該装置90は、
前記取得モジュールが予め生成されたモデルに基づいて前処理された質問を処理するようにトリガするように、前記質問を前処理する前処理モジュール94をさらに含む。
一部の実施例において、図10を参照し、当該装置90は、
前記ユーザとのインタラクティブ対話に基づいて、オンライン学習を行うオンライン学習モジュール95をさらに含む。
一部の実施例において、図10を参照し、当該装置90は、
他のシステムを呼び出し、又は他のシステムによって呼び出されるためのインターフェースを提供するオープンインターフェース96をさらに含む。
なお、本実施例の装置は、上記方法の実施例に対応するものであり、具体的な内容は、方法の実施例の関連説明を参照することができ、ここでは、詳しく説明しない。
本実施例において、人間対話コーパスを収集することにより、人間対話コーパスに基づいて、モデルを訓練して生成することができ、機器が、人間の対話スタイルを学習することができるようになる。モデルを対話プロセスに適用した後、機器は、人間の対話スタイルで人間と対話型インタラクションすることができ、ヒューマンマシンインタラクションは、本当の人間同士の対話型インタラクションの効果を有するようになる。さらに、ヒューマンマシンインタラクションの効果を向上させるために、オンライン学習により、新しいデータをリアルタイムで学習することができる。さらに、オープンインターフェースを介して、他のシステムによって呼び出され、又は、他のシステムを呼び出すことができ、ヒューマンマシンインタラクションサービスをよりよく提供する。
なお、上記各実施例における同様又は類似の部分は、相互参照することができ、いくつかの実施例において、詳しく説明されていない内容は、他の実施例における同様又は類似の内容を参照することができる。
本出願の実施例は、プロセッサと、プロセッサによって実行可能な命令を記憶するためのメモリと、を含む機器を提供し、前記プロセッサが、ユーザによって入力された質問を受信するステップと、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、前記回答をユーザにフィードバックするステップとを実行するように構成される。
本出願の実施例は、非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記記憶媒体における命令がプロセッサによって実行される場合、プロセッサは、ユーザによって入力された質問を受信するステップと、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、前記回答をユーザにフィードバックするステップとを実行する可能である。
本出願の実施例は、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品における命令がプロセッサによって実行される場合、プロセッサは、ユーザによって入力された質問を受信するステップと、人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、前記回答をユーザにフィードバックするステップとを実行可能である。
なお、本出願の説明において、「第1」、「第2」などの用語は、単に目的を説明するためのものであり、比較的な重要性を指示又は暗示すると理解してはいけない。また、本出願の説明において、ほかの説明がない限り、「複数」とは、少なくとも二つを意味する。
フローチャート、又はここで他の方式により説明されるいかなるプロセス又は方法の説明は、特定のロジック機能又はプロセスのステップを実現するための一つ又はそれ以上の実行可能な命令のコードを含むモジュール、セグメント又は部分と理解されてもよい。また、本出願の好ましい実施形態の範囲は、他の実現方式が含まれており、例示され又は議論された順序に従わなくてもよく、言及された機能が実質的に同時に、又は逆の順序に応じて機能を実行することを含む。本出願の実施例が属する技術分野の当業者は、これを理解すべきである。
なお、本出願の各部分は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせにより実現できる。上記実施形態では、複数のステップ又は方法は、メモリに記憶され、且つ適切なコマンド実行システムによって実行されるソフトウェア又はファームウェアにより実現することができる。例えば、ハードウェアにより実現される場合は、他の実施形態と同じく、本分野の以下の公知技術のうち何れか一つ又はこれらの組み合わせにより実現することができる。データ信号のロジック機能を実現するための論理ゲート回路を備えたディスクリート論理回路、適切な組み合わせ論理ゲート回路を備えた専用集積回路、プログラム可能なゲートアレイ(PGA)、フィールド
プログラム可能なゲートアレイ( FPGA)などである。
当業者は、上記実施形態に係る方法に含まれている全部又は一部のステップが、プログラムにより関連するハードウェアを命令することにより完成できることを理解できる。前記プログラムは、コンピュータ読み取り可能な媒体に記憶されてもよく、当該プログラムは実行時に、方法の実施形態における一つのステップ又はその組み合わせを含むことができる。
また、本出願の各実施形態に係る各機能ユニットは、一つの処理モジュールに集積されてもよく、各ユニットが物理的に独立して存在してもよく、2つ又は2つ以上のユニットが一つのモジュールに集積されてもよい。上記集積されたモジュールは、ハードウェアの形式により実現されてもよく、ソフトウェアの機能モジュールの形式により実現されてもよい。上記集積されたモジュールがソフトウェアの機能モジュールの形式により実現され、独立の製品として販売又は使用される場合、一つのコンピュータ読み取り可能な記憶媒体に記憶することもできる。
上記記憶媒体は、読み出し専用メモリや磁気ディスク、光ディスクなどであってもよい。
本明細書の説明において、「一実施例」、「一部の実施例」、「例」、「具体的な例」、或いは「一部の例」などの用語を参考した説明とは、当該実施例或いは例に合わせて説明された具体的な特徴、構成、材料或いは特性が、本出願の少なくとも一つの実施例或いは例に含まれることである。本明細書において、上記用語に対する例示的な説明は、必ずしも同じ実施例或いは例を示すものではない。また、説明された具体的な特徴、構成、材料或いは特性は、いずれか一つ或いは複数の実施例又は例において適切に結合することができる。
以上に本出願の実施例を示して説明したが、上記実施例は、例示的なものであり、本出願を限定するものと理解してはいけない。当業者は、本出願の範囲内に、上記実施例に対して変化、修正、取り替え及び変形を行うことができる。

Claims (19)

  1. ユーザによって入力された質問を受信するステップと、
    人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップと、
    前記回答をユーザにフィードバックするステップと、
    を含む、
    ことを特徴とする人工知能に基づくヒューマンマシンインタラクション方法。
  2. 前記モデルは、
    質問中のキーワードと回答中のキーワードとの間のマッピング関係を示すマッピング関係と、
    コンテキスト情報に基づいて、複数のマッピング関係から最適なマッピング関係を決定し、決定されたマッピング関係におけるキーワードにマッチングするコロケーション単語を生成する予測モデルと、
    用語の順序を調整し、調整された用語に基づいて、文法構造に適合する文を生成する文法モデルと、を含む、
    ことを特徴とする請求項1に記載の方法。
  3. 予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得するステップは、
    前記マッピング関係に基づいて、ユーザによって入力された質問中のキーワードに対応する回答中のキーワードを決定するステップと、
    前記予測モデルに基づいて、決定されたキーワードから最適な1セットのキーワードを選択し、選択された1セットのキーワードに基づいて、コロケーション単語を生成するステップと、
    前記文法モデルに基づいて、前記選択された1セットのキーワード及び生成されたコロケーション単語の文法構造を調整して、人間の対話スタイルを有する回答として文法構造を満たす文を取得するステップと、
    を含む、
    ことを特徴とする請求項2に記載の方法。
  4. 前記方法は、人間対話コーパスにおける質問中のキーワード及び対応する回答中のキーワードを抽出し、抽出されたキーワードに基づいて、前記マッピング関係を生成するステップをさらに含む、
    ことを特徴とする請求項2又は3に記載の方法。
  5. 前記方法は、人間対話コーパスにおける質問中のキーワード及び対応する回答中のキーワードを抽出し、且つ対応するコンテキスト情報を抽出し、抽出されたキーワード及びコンテキスト情報に基づいて、前記予測モデルを生成するステップをさらに含む、
    ことを特徴とする請求項2〜4のいずれかに記載の方法。
  6. 前記方法は、人間対話コーパスに基づいて、前記文法モデルを生成し、又は、オープンインターフェースを介して他のシステムから前記文法モデルを取得するステップをさらに含む、
    ことを特徴とする請求項2〜5のいずれかに記載の方法。
  7. 前記方法は、予め生成されたモデルに基づいて、前処理された質問を処理するように、前記質問を前処理するステップをさらに含む、
    ことを特徴とする請求項1〜6のいずれかに記載の方法。
  8. 前記方法は、前記ユーザとのインタラクティブ対話に基づいて、オンライン学習を行うステップをさらに含む、
    ことを特徴とする請求項1〜7のいずれかに記載の方法。
  9. 前記方法は、オープンインターフェースを介して、他のシステムを呼び出し、又は他のシステムによって呼び出されるステップをさらに含む、
    ことを特徴とする請求項1〜8のいずれかに記載の方法。
  10. ユーザによって入力された質問を受信する受信モジュールと、
    人間対話コーパスに基づいて予め生成されたモデルに基づいて、前記質問を処理し、前記質問に対応する人間の対話スタイルを有する回答を取得する取得モジュールと、
    前記回答をユーザにフィードバックするフィードバックモジュールと、
    を含む、
    ことを特徴とする人工知能に基づくヒューマンマシンインタラクション装置。
  11. 前記モデルは、
    質問中のキーワードと回答中のキーワードとの間のマッピング関係を示すマッピング関係と、
    コンテキスト情報に基づいて、複数のマッピング関係から最適なマッピング関係を決定し、決定されたマッピング関係におけるキーワードにマッチングするコロケーション単語を生成する予測モデルと、
    用語の順序を調整し、調整された用語に基づいて、文法構造に適合する文を生成する文法モデルと、を含む、
    ことを特徴とする請求項10に記載の装置。
  12. 前記取得モジュールは、
    前記マッピング関係に基づいて、ユーザによって入力された質問中のキーワードに対応する回答中のキーワードを決定するマッピングサブモジュールと、
    前記予測モデルに基づいて、決定されたキーワードから最適な1セットのキーワードを選択し、選択された1セットのキーワードに基づいて、コロケーション単語を生成する予測サブモジュールと、
    前記文法モデルに基づいて、前記選択された1セットのキーワード及び生成されたコロケーション単語の文法構造を調整して、人間の対話スタイルを有する回答として文法構造を満たす文を取得する文法分析サブモジュールと、
    を含む、
    ことを特徴とする請求項11に記載の装置。
  13. 前記マッピングサブモジュールは、さらに、人間対話コーパスにおける質問中のキーワード及び対応する回答中のキーワードを抽出し、抽出されたキーワードに基づいて、前記マッピング関係を生成し、又は、
    前記予測サブモジュールは、さらに、人間対話コーパスにおける質問中のキーワード及び対応する回答中のキーワードを抽出し、且つ対応するコンテキスト情報を抽出し、抽出されたキーワード及びコンテキスト情報に基づいて、前記予測モデルを生成し、又は、
    前記文法分析サブモジュールは、さらに、人間対話コーパスに基づいて、前記文法モデルを生成し、又は、オープンインターフェースを介して他のシステムから前記文法モデルを取得する、
    ことを特徴とする請求項12に記載の装置。
  14. 前記装置は、前記取得モジュールが予め生成されたモデルに基づいて、前処理された質問を処理するようにトリガするように、前記質問を前処理する前処理モジュールをさらに含む、
    ことを特徴とする請求項10〜13のいずれかに記載の装置。
  15. 前記装置は、前記ユーザとのインタラクティブ対話に基づいて、オンライン学習を行うオンライン学習モジュールをさらに含む、
    ことを特徴とする請求項10〜14のいずれかに記載の装置。
  16. 前記装置は、他のシステムを呼び出し、又は他のシステムによって呼び出されるためのインターフェースを提供するオープンインターフェースをさらに含む、
    ことを特徴とする請求項10〜15のいずれかに記載の装置。
  17. 請求項1〜9のいずれかに記載の方法を実行するように構成されるプロセッサと、
    プロセッサによって実行可能な命令を記憶するためのメモリと、を含む、
    ことを特徴とする機器。
  18. 非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記記憶媒体における命令がプロセッサによって実行される場合、プロセッサは、
    請求項1〜9のいずれかに記載の方法を実行可能である、
    ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
  19. コンピュータプログラム製品であって、
    前記コンピュータプログラム製品における命令がプロセッサによって実行される場合、プロセッサは、
    請求項1〜9のいずれかに記載の方法を実行可能である、
    ことを特徴とするコンピュータプログラム製品。
JP2019501993A 2016-09-05 2017-01-23 人工知能に基づくヒューマンマシンインタラクション方法及び装置 Active JP6726800B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610803645.8 2016-09-05
CN201610803645.8A CN106469212B (zh) 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置
PCT/CN2017/072267 WO2018040501A1 (zh) 2016-09-05 2017-01-23 基于人工智能的人机交互方法和装置

Publications (2)

Publication Number Publication Date
JP2019528512A true JP2019528512A (ja) 2019-10-10
JP6726800B2 JP6726800B2 (ja) 2020-07-22

Family

ID=58230458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019501993A Active JP6726800B2 (ja) 2016-09-05 2017-01-23 人工知能に基づくヒューマンマシンインタラクション方法及び装置

Country Status (6)

Country Link
US (1) US11645547B2 (ja)
EP (1) EP3508991A4 (ja)
JP (1) JP6726800B2 (ja)
KR (1) KR102170563B1 (ja)
CN (1) CN106469212B (ja)
WO (1) WO2018040501A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022058328A (ja) * 2020-12-18 2022-04-12 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 分散型モデルトレーニング装置および方法、電子機器、記憶媒体、ならびに、コンピュータプログラム
JP2023536005A (ja) * 2020-11-18 2023-08-22 エバオテック コーポレーション データクラスタリング方法及びシステム、データ記憶方法及びシステム並びに記憶媒体

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649778B (zh) * 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN107168990A (zh) * 2017-03-28 2017-09-15 厦门快商通科技股份有限公司 基于用户性格的智能客服***及对话方法
US11151992B2 (en) 2017-04-06 2021-10-19 AIBrain Corporation Context aware interactive robot
US10963493B1 (en) * 2017-04-06 2021-03-30 AIBrain Corporation Interactive game with robot system
US10839017B2 (en) 2017-04-06 2020-11-17 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system utilizing an advanced memory graph structure
US10929759B2 (en) 2017-04-06 2021-02-23 AIBrain Corporation Intelligent robot software platform
US10810371B2 (en) 2017-04-06 2020-10-20 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
CN108733722B (zh) * 2017-04-24 2020-07-31 北京京东尚科信息技术有限公司 一种对话机器人自动生成方法及装置
US10628754B2 (en) 2017-06-06 2020-04-21 At&T Intellectual Property I, L.P. Personal assistant for facilitating interaction routines
US11599729B2 (en) * 2017-06-15 2023-03-07 Microsoft Technology Licensing, Llc Method and apparatus for intelligent automated chatting
CN108304436B (zh) * 2017-09-12 2019-11-05 深圳市腾讯计算机***有限公司 风格语句的生成方法、模型的训练方法、装置及设备
CN110019702B (zh) * 2017-09-18 2023-04-07 阿里巴巴集团控股有限公司 数据挖掘方法、装置和设备
CN107818787B (zh) * 2017-10-31 2021-02-05 努比亚技术有限公司 一种语音信息的处理方法、终端及计算机可读存储介质
CN108010531B (zh) * 2017-12-14 2021-07-27 南京美桥信息科技有限公司 一种可视智能问询方法及***
CN108038230B (zh) * 2017-12-26 2022-05-20 北京百度网讯科技有限公司 基于人工智能的信息生成方法和装置
CN108153875B (zh) * 2017-12-26 2022-03-11 北京金山安全软件有限公司 语料处理方法、装置、智能音箱和存储介质
CN108711423A (zh) * 2018-03-30 2018-10-26 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN110471538B (zh) * 2018-05-10 2023-11-03 北京搜狗科技发展有限公司 一种输入预测方法及装置
CN109033428B (zh) * 2018-08-10 2021-09-10 深圳市磐创网络科技有限公司 一种智能客服方法及***
WO2020060151A1 (en) * 2018-09-19 2020-03-26 Samsung Electronics Co., Ltd. System and method for providing voice assistant service
CN109684453A (zh) * 2018-12-26 2019-04-26 联想(北京)有限公司 一种信息处理方法及电子设备
CN109840255B (zh) * 2019-01-09 2023-09-19 平安科技(深圳)有限公司 答复文本生成方法、装置、设备及存储介质
CN110069707A (zh) * 2019-03-28 2019-07-30 广州创梦空间人工智能科技有限公司 一种人工智能自适应互动教学***
CN110046242A (zh) * 2019-04-22 2019-07-23 北京六行君通信息科技股份有限公司 一种自动应答装置及方法
CN110223697B (zh) 2019-06-13 2022-04-22 思必驰科技股份有限公司 人机对话方法及***
CN110689078A (zh) * 2019-09-29 2020-01-14 浙江连信科技有限公司 基于人格分类模型的人机交互方法、装置及计算机设备
KR102380397B1 (ko) * 2019-10-08 2022-03-31 채명진 IoT센서 및 인공지능을 이용한 스마트 빌딩 관리방법
KR102385198B1 (ko) * 2020-06-25 2022-04-12 (주)아크릴 인공지능 간의 대화를 위한 대화생성 시스템 및 방법
CN113761144A (zh) * 2020-11-16 2021-12-07 北京沃东天骏信息技术有限公司 应答信息确定方法和装置
CN112667796B (zh) * 2021-01-05 2023-08-11 网易(杭州)网络有限公司 一种对话回复方法、装置、电子设备及可读存储介质
US11610581B2 (en) * 2021-02-05 2023-03-21 International Business Machines Corporation Multi-step linear interpolation of language models
CN113032540B (zh) * 2021-03-19 2023-06-23 北京百度网讯科技有限公司 人机交互方法、装置、设备和存储介质
CN113488030A (zh) * 2021-07-06 2021-10-08 思必驰科技股份有限公司 语音点餐方法、装置及***
CN113378583A (zh) * 2021-07-15 2021-09-10 北京小米移动软件有限公司 对话回复方法及装置、对话模型训练方法及装置、存储介质
CN116561286B (zh) * 2023-07-06 2023-10-27 杭州华鲤智能科技有限公司 一种对话方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090070311A1 (en) * 2007-09-07 2009-03-12 At&T Corp. System and method using a discriminative learning approach for question answering
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN101075435B (zh) * 2007-04-19 2011-05-18 深圳先进技术研究院 一种智能聊天***及其实现方法
CN101763212B (zh) * 2009-04-30 2012-08-15 广东国笔科技股份有限公司 人机交互***及其相关***、设备和方法
EP2839391A4 (en) * 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9424233B2 (en) * 2012-07-20 2016-08-23 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
KR101515413B1 (ko) 2013-08-14 2015-04-29 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
KR102175539B1 (ko) * 2013-10-18 2020-11-06 에스케이텔레콤 주식회사 사용자 발화 스타일에 따른 대화형 서비스 장치 및 방법
CN104615646A (zh) * 2014-12-25 2015-05-13 上海科阅信息技术有限公司 智能聊天机器人***
CN105095444A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 信息获取方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090070311A1 (en) * 2007-09-07 2009-03-12 At&T Corp. System and method using a discriminative learning approach for question answering
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023536005A (ja) * 2020-11-18 2023-08-22 エバオテック コーポレーション データクラスタリング方法及びシステム、データ記憶方法及びシステム並びに記憶媒体
JP7423859B2 (ja) 2020-11-18 2024-01-29 エバオテック コーポレーション データクラスタリング方法及びシステム、データ記憶方法及びシステム並びに記憶媒体
JP2022058328A (ja) * 2020-12-18 2022-04-12 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 分散型モデルトレーニング装置および方法、電子機器、記憶媒体、ならびに、コンピュータプログラム

Also Published As

Publication number Publication date
CN106469212B (zh) 2019-10-15
EP3508991A1 (en) 2019-07-10
KR102170563B1 (ko) 2020-10-27
US20190286996A1 (en) 2019-09-19
KR20190028793A (ko) 2019-03-19
US11645547B2 (en) 2023-05-09
JP6726800B2 (ja) 2020-07-22
WO2018040501A1 (zh) 2018-03-08
CN106469212A (zh) 2017-03-01
EP3508991A4 (en) 2020-02-12

Similar Documents

Publication Publication Date Title
JP6726800B2 (ja) 人工知能に基づくヒューマンマシンインタラクション方法及び装置
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
US8874443B2 (en) System and method for generating natural language phrases from user utterances in dialog systems
JP6819990B2 (ja) 対話システム及びそのためのコンピュータプログラム
EP3582119A1 (en) Spoken language understanding system and method using recurrent neural networks
US8935163B2 (en) Automatic conversation system and conversation scenario editing device
CN110730953B (zh) 基于创建者提供的内容定制交互式对话应用的方法、***
US11093110B1 (en) Messaging feedback mechanism
AU2019219717B2 (en) System and method for analyzing partial utterances
JPH08106298A (ja) 対話処理装置及び対話処理方法
Tarek et al. Towards highly adaptive edu-chatbot
Wärnestål User evaluation of a conversational recommender system
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
CN111128175B (zh) 口语对话管理方法及***
CN112965603A (zh) 一种人机交互的实现方法和***
CN111968646A (zh) 一种语音识别方法及装置
KR20210123545A (ko) 사용자 피드백 기반 대화 서비스 제공 방법 및 장치
Hung et al. Context‐Centric Speech‐Based Human–Computer Interaction
TWI594136B (zh) 一種通過語音對機器人進行訓練的系統及方法
Altinkaya et al. Assisted speech to enable second language
McTear Rule-Based Dialogue Systems: Architecture, Methods, and Tools
Huang et al. DuIVRS: A Telephonic Interactive Voice Response System for Large-Scale POI Attribute Acquisition at Baidu Maps
Wahlster Robust translation of spontaneous speech: a multi-engine approach
JP6985311B2 (ja) 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法
Garg et al. Conversion of Native Speech into Indian Sign Language to Facilitate Hearing Impairment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200629

R150 Certificate of patent or registration of utility model

Ref document number: 6726800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250