JP7295445B2 - Information processing device and program - Google Patents
Information processing device and program Download PDFInfo
- Publication number
- JP7295445B2 JP7295445B2 JP2021097444A JP2021097444A JP7295445B2 JP 7295445 B2 JP7295445 B2 JP 7295445B2 JP 2021097444 A JP2021097444 A JP 2021097444A JP 2021097444 A JP2021097444 A JP 2021097444A JP 7295445 B2 JP7295445 B2 JP 7295445B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- missing
- words
- text
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置およびプログラムに関する。 The present invention relates to an information processing device and program.
近年、ユーザと対話する対話システムが普及している。対話システムは、ユーザが入力した音声やテキストに応じた処理をする。例えば、ユーザが行いたい作業を対話システムに伝えると、対話システムは作業に対応するソフトウェアを起動する。また、例えば、対話システムは、ユーザの質問内容に応じた応答を出力する。 2. Description of the Related Art In recent years, interactive systems that interact with users have become widespread. A dialog system performs processing according to voice or text input by a user. For example, when the user tells the dialog system what he or she wants to do, the dialog system activates the software corresponding to the task. Also, for example, the dialogue system outputs a response according to the contents of the user's question.
対話システムに関する技術としては、例えば、電子デバイスの多くの異なるサービスに関するユーザの体験を統一、簡略化及び改善できるインテリジェント自動アシスタントが提案されている。また、例えば、ダイアログ・システム・インテントおよび1つまたは複数の要求されたパラメータに基づいて、アクション命令を生成するダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成が提案されている。 Technologies related to interactive systems, for example, have proposed intelligent automated assistants that can unify, simplify, and improve the user's experience with many different services on electronic devices. Also proposed is parameter collection and automatic dialog generation in a dialog system that generates action instructions based on, for example, a dialog system intent and one or more requested parameters.
対話システムは、あらかじめ設定されている要素それぞれに対応する単語がユーザが入力したテキストにすべて含まれている場合、適切な応答ができることが多い。そこで、不足した要素についての選択入力をユーザから受け付け、受け付けた入力内容を踏まえて応答することが考えられる。しかし、ユーザに選択入力を要求するような場合、円滑な対話ができなくなる。 Dialog systems are often able to respond appropriately when the text entered by the user contains all the words corresponding to each of the preset elements. Therefore, it is conceivable to receive a selection input for the missing element from the user and respond based on the received input content. However, when the user is requested to input a selection, smooth interaction cannot be achieved.
1つの側面では、本件は、円滑な対話ができるシステムを実現することを目的とする。 In one aspect, the object of the present invention is to realize a system capable of smooth dialogue.
1つの案では、処理部を有する情報処理装置が提供される。処理部は、入力文から伝達要素それぞれに対応する単語を抽出し、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択し、入力文に含まれる単語と定型文とに基づいた応答を出力する。 One proposal provides an information processing apparatus having a processing unit. The processing unit extracts words corresponding to each of the conveying elements from the input sentence, selects fixed phrases based on the missing conveying elements from the conveying elements for which the corresponding words are not extracted, and extracts the words included in the input sentence and Output responses based on fixed phrases.
1態様によれば、円滑な対話ができるシステムを実現することができる。 According to one aspect, it is possible to realize a system capable of smooth dialogue.
以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理装置の一例を示す図である。第1の実施の形態は、情報処理装置10が入力文1に対する自然な応答2を出力するものである。
Hereinafter, this embodiment will be described with reference to the drawings. It should be noted that each embodiment can be implemented by combining a plurality of embodiments within a consistent range.
[First embodiment]
1 is a diagram illustrating an example of an information processing apparatus according to a first embodiment; FIG. In the first embodiment, an
情報処理装置10は、対話システムを提供するコンピュータである。情報処理装置10は、サーバコンピュータであってもよいし、クライアントコンピュータであってもよい。情報処理装置10は、処理部11を有する。処理部11は、情報処理装置10を制御し、所要の処理を実行可能である。処理部11は、例えば、情報処理装置10が有するプロセッサ、または演算回路である。
The
まず、処理部11は、入力文1を取得する。入力文1は、ユーザから入力されたテキストである。入力文1は、音声入力されたユーザの発話を音声認識によってテキストとしたものであってもよいし、ユーザがテキスト入力によって入力したテキストであってもよい。入力文1は、一例として、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」というテキストである。
First, the
次に、処理部11は、入力文1に含まれる単語からカテゴリを特定する。例えば、処理部11は、複数のカテゴリそれぞれに対応する単語を示す情報を参照する。そして、処理部11は、対応する単語が入力文1に最も多く含まれるカテゴリを入力文1のカテゴリとして特定する。一例として、処理部11は、入力文1に含まれる「彼氏」、「ディナー」、「おしゃれ」および「洋服」から、入力文1のカテゴリをファッションと特定する。
Next, the
また、処理部11は、入力文1に含まれる単語から意図を特定する。例えば、処理部11は、複数の意図それぞれに対応する単語を示す情報を参照する。そして、処理部11は、対応する単語が入力文1に最も多く含まれる意図を入力文1の意図として特定する。一例として、処理部11は、入力文1に含まれる「調べて」から、入力文1のカテゴリを検索と特定する。
Also, the
次に、処理部11は、入力文1から伝達要素それぞれに対応する単語を抽出する。伝達要素は、入力文1に対するユーザの要求を満たす応答をするための情報を伝達するために、入力文1に要求される要素である。伝達要素には、例えば、時間を示す「いつ」、場所を示す「どこ」、物を示す「なに」、人を示す「だれ」等が含まれる。また、伝達要素は、カテゴリごとに設定されている。処理部11は、特定したカテゴリに対応する伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素を特定する。
Next, the
一例として、処理部11は、入力文1のカテゴリであるファッションに対応する伝達要素の、「いつ」、「どこ」、「なに」、「だれ」それぞれに対応する単語を入力文1から抽出する。すると、処理部11は、「どこ」に対応する「ディナー」、「なに」に対応する「洋服」および「だれ」に対応する「彼氏」を抽出する。処理部11は、対応する単語が抽出されなかった「いつ」を、欠落伝達要素と特定する。
As an example, the
処理部11は、欠落伝達要素と意図とに基づいて定型文を選択する。例えば、処理部11は、カテゴリと意図と欠落伝達要素との組み合わせそれぞれに対応する定型文の情報を参照する。そして、処理部11は、入力文1から特定したカテゴリと意図と欠落伝達要素との組み合わせに対応する定型文を選択する。なお、定型文は、空欄を含んでいてもよい。一例として、処理部11は、入力文1のカテゴリであるファッションと、入力文1の意図である検索と、入力文1の欠落伝達要素である「いつ」との組み合わせに対応する定型文「[]は[]の予定ですか。」を選択する。
The
そして、処理部11は、入力文1に含まれる単語と定型文とに基づいた応答2を出力する。例えば、処理部11は、定型文に含まれる空欄に、入力文1に含まれる単語と、欠落伝達要素を要求するための単語とを入れることで応答2を生成する。一例として、処理部11は、定型文「[]は[]の予定ですか。」に、入力文1に含まれる単語「ディナー」と、欠落伝達要素「いつ」を要求するための単語「いつ頃」を入れることで、「ディナーは、いつ頃の予定ですか。」というテキストを応答2として生成する。そして、処理部11は、生成した応答2を出力する。処理部11は、応答2のテキストを示す音声を出力してもよいし、応答2のテキストを画面表示してもよい。
Then, the
第1の実施の形態によれば、情報処理装置10の処理部11は、入力文1から伝達要素それぞれに対応する単語を抽出する。処理部11は、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択する。そして、処理部11は、入力文に含まれる単語と定型文とに基づいた応答2を出力する。
According to the first embodiment, the
ここで、情報処理装置10は、伝達要素に対応する単語をすべてユーザから取得できれば、ユーザの要求を満たすように応答できる可能性が高い。情報処理装置10は、応答2による自然なやりとりによって欠落伝達要素に対応する単語をユーザに要求できる。よって、情報処理装置10は、円滑な対話ができるシステムを実現することができる。
Here, if the
また、処理部11は、入力文1に含まれる単語からカテゴリを特定し、カテゴリに対応する伝達要素のうちの欠落伝達要素に基づいて定型文を選択する。これにより、情報処理装置10は、正確な欠落伝達要素に対応する単語をユーザに要求できる。
Further, the
また、処理部11は、入力文1に含まれる単語から意図を特定し、欠落伝達要素と意図とに基づいて定型文を選択する。これにより、情報処理装置10は、ユーザが入力文1を入力した意図に合わせた応答ができる。
In addition, the
なお、処理部11は、第1入力文に含まれる単語からカテゴリを特定し、伝達要素のうちの対応する単語が第1入力文から抽出されなかった第1欠落伝達要素に基づいて第1定型文を選択し、第1入力文に含まれる単語と第1定型文とに基づいた第1応答を出力し、第2入力文を取得すると、伝達要素のうちの対応する単語が第1入力文と第2入力文とから抽出されなかった第2欠落伝達要素に基づいて第2定型文を選択し、第1入力文に含まれる単語と第2入力文に含まれる単語と第2定型文とに基づいた第2応答を出力してもよい。これにより、情報処理装置10は、ユーザと複数回のやりとりがある場合も欠落伝達要素をユーザに自然に要求できる。
Note that the
〔第2の実施の形態〕
次に、第2の実施の形態について説明する。第2の実施の形態は、対話システムをユーザに提供するものである。
[Second embodiment]
Next, a second embodiment will be described. The second embodiment provides a dialogue system for users.
図2は、第2の実施の形態に係る情報処理システムの一例を示す図である。第2の実施の形態の情報処理システムは、情報処理装置100およびPC(Personal Computer)200を有する。情報処理装置100およびPC200は、ネットワーク30に接続されている。ネットワーク30は、例えば、インターネット等の広域ネットワークである。
FIG. 2 is a diagram illustrating an example of an information processing system according to the second embodiment. The information processing system of the second embodiment has an
情報処理装置100は、対話システムを提供するサーバコンピュータである。情報処理装置100は、ユーザ20によるユーザ発話をPC200から取得する。情報処理装置100は、取得したユーザ発話に対する応答を生成する。
The
PC200は、ユーザ20が操作するコンピュータである。PC200は、ユーザ20のユーザ発話を取得する。PC200は、取得したユーザ発話を情報処理装置100に送信する。PC200は、ユーザ発話に対する応答を情報処理装置100から取得し、取得した応答を出力する。
なお、第2の実施の形態では、情報処理装置100がユーザ20の発話音声を取得するが、PC200がユーザ20の発話音声から音声認識によって発話音声の内容を示すテキストを生成し、生成したテキストを情報処理装置100に送信してもよい。また、第2の実施の形態では、PC200がユーザ20からの音声を取得し、情報処理装置100が応答を生成し、生成した応答をPC200に出力させるが、情報処理装置100が有する機能をPC200が有し、PC200が全体の処理を実行してもよい。
In the second embodiment, the
図3は、情報処理装置のハードウェアの一構成例を示す図である。情報処理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101は、プログラムの命令を実行するプロセッサである。なお、CPU101は複数のプロセッサコアを含んでもよい。また、CPU101は、複数のプロセッサであってもよく、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)等であってもよい。また、CPU101がプログラムを実行することで実現する機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)等の電子回路で実現してもよい。CPU101には、バス109を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。
FIG. 3 is a diagram illustrating a configuration example of hardware of an information processing apparatus. The
RAM102は、情報処理装置100の主記憶装置である。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に利用する各種データが格納される。なお、情報処理装置100は、RAM以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。
A
バス109に接続されている周辺機器としては、HDD(Hard Disk Drive)103、GPU(Graphics Processing Unit)104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。
Peripheral devices connected to the bus 109 include a HDD (Hard Disk Drive) 103 , a GPU (Graphics Processing Unit) 104 , an
HDD103は、情報処理装置100の補助記憶装置である。HDD103は、内蔵した磁気ディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、情報処理装置100は、フラッシュメモリやSSD(Solid State Drive)等の他の種類の補助記憶装置を備えてもよく、複数の補助記憶装置を備えてもよい。
The
GPU104には、モニタ31が接続されている。GPU104は、CPU101からの命令に従って、画像をモニタ31の画面に表示させる。モニタ31としては、有機EL(Electro Luminescence)を用いた表示装置や液晶表示装置等がある。
A monitor 31 is connected to the
入力インタフェース105には、キーボード32とマウス33とが接続されている。入力インタフェース105は、キーボード32やマウス33から送られてくる信号をCPU101に送信する。なお、マウス33は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボール等がある。
A keyboard 32 and a mouse 33 are connected to the
光学ドライブ装置106は、レーザ光等を利用して、光ディスク34に記録されたデータの読み取りを行う。光ディスク34は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク34には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等がある。
The
機器接続インタフェース107は、情報処理装置100に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置35やメモリリーダライタ36を接続することができる。メモリ装置35は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ36は、メモリカード37へのデータの書き込み、またはメモリカード37からのデータの読み出しを行う装置である。メモリカード37は、カード型の記録媒体である。
The
ネットワークインタフェース108は、ネットワーク30に接続されている。ネットワークインタフェース108は、ネットワーク30を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。
情報処理装置100は、以上のようなハードウェア構成によって、第2の実施の形態の処理機能を実現することができる。なお、PC200も、図3に示した情報処理装置100と同様のハードウェアにより実現することができる。ただし、PC200は、音声を入出力するためのマイクおよびスピーカをさらに有する。また、第1の実施の形態に示した情報処理装置10も、図3に示した情報処理装置100と同様のハードウェアにより実現することができる。また、CPU101は、第1の実施の形態に示した処理部11の一例である。
The
情報処理装置100は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施の形態の処理機能を実現する。情報処理装置100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置100に実行させるプログラムをHDD103に格納しておくことができる。CPU101は、HDD103内のプログラムの少なくとも一部をRAM102にロードし、プログラムを実行する。また、情報処理装置100に実行させるプログラムを、光ディスク34、メモリ装置35、メモリカード37等の可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばCPU101からの制御により、HDD103にインストールされた後、実行可能となる。また、CPU101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
The
図2に示すような情報処理システムで、情報処理装置100は、ユーザ20に対話システムを提供する。情報処理装置100は、ユーザ20の要求を満たす応答をするための情報を伝達するために要求される伝達要素に対応する単語がユーザ発話に含まれていれば、適切な応答ができることが多い。伝達要素には、例えば、時間を示す「いつ」、場所を示す「どこ」、物を示す「なに」、人を示す「だれ」、金額を示す「いくら」等が含まれる。また、伝達要素は、対話内容のカテゴリによって変動することがある。
In the information processing system as shown in FIG. 2, the
ここで、ユーザ発話に対応する単語が含まれていない伝達要素(欠落伝達要素)がある場合、ユーザ20の要求を満たす応答をするために、欠落伝達要素に対応する単語を推定するための情報を入力する入力操作をユーザ20に促すことが考えられる。しかし、ユーザ20に入力操作を促す場合、円滑な対話ができない。そこで、第2の実施の形態では、情報処理装置100は、欠落伝達要素に対応する定型文を用いた応答を出力することで円滑な対話によって欠落伝達要素をユーザ20に要求する。
Here, when there is a transfer element (missing transfer element) that does not contain a word corresponding to the user's utterance, information for estimating the word corresponding to the missing transfer element in order to make a response that satisfies the request of the user 20 It is conceivable to prompt the user 20 to perform an input operation of inputting . However, when prompting the user 20 to perform an input operation, a smooth dialogue cannot take place. Therefore, in the second embodiment, the
次に、情報処理装置100の機能について詳細に説明する。
図4は、情報処理装置の機能例を示すブロック図である。情報処理装置100は、記憶部110、発話解析部120、単語解析部130および応答生成部140を有する。記憶部110は、RAM102またはHDD103の記憶領域を用いて実現される。発話解析部120、単語解析部130および応答生成部140は、RAM102に記憶されたプログラムをCPU101が実行することで実現される。記憶部110は、カテゴリ情報111、意図情報112、伝達要素情報113、類義語情報114、欠落伝達要素情報115、定型文情報116およびアイテム情報117を有する。
Next, functions of the
FIG. 4 is a block diagram showing an example of functions of the information processing apparatus. The
カテゴリ情報111は、カテゴリと単語との対応関係を示す。意図情報112は、意図と単語との対応関係を示す。伝達要素情報113は、カテゴリと伝達要素との対応関係およびカテゴリと伝達要素との組み合わせと単語との対応関係を示す。類義語情報114には、伝達要素情報113に登録されている単語の類義語が登録されている。欠落伝達要素情報115は、欠落伝達要素を特定するための情報である。定型文情報116は、カテゴリと意図と欠落伝達要素との組み合わせと、定型文との対応関係を示す。アイテム情報117は、テキスト内に含まれる単語から当該テキストと関連するアイテムを特定するための情報である。
The
発話解析部120は、ユーザ20の発話音声から単語を抽出する。まず、発話解析部120は、ユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。発話解析部120は、取得したユーザ発話に対する音声認識によって、ユーザ発話を示すテキスト(発話テキスト)を生成し、発話テキストに含まれる単語に分割をする。なお、発話テキストは、第1の実施の形態に示した入力文1および第1入力文の一例である。
The
また、発話解析部120は、応答生成部140による応答出力から一定期間内に発せられたユーザ発話(二回目以降のユーザ発話)から、単語を抽出する。例えば、発話解析部120は、二回目以降のユーザ発話を取得すると、音声認識によって二回目以降のユーザ発話を示すテキスト(二回目以降の発話テキスト)を生成し、二回目以降の発話テキストに含まれる単語に分割をする。なお、二回目以降の発話テキストは、第1の実施の形態に示した第2入力文の一例である。
The
単語解析部130は、発話テキストから伝達要素それぞれに対応する単語を抽出する。まず、単語解析部130は、発話テキストのカテゴリおよび意図を特定する。例えば、単語解析部130は、カテゴリ情報111から、発話テキストに含まれる単語に対応するカテゴリを、発話テキストのカテゴリとして特定する。また、例えば、単語解析部130は、意図情報112から、発話テキストに含まれる単語に対応する意図を、発話テキストの意図として特定する。次に、単語解析部130は、欠落伝達要素情報115から発話テキストのカテゴリに対応する伝達要素を特定する。単語解析部130は、伝達要素情報113から、発話テキストのカテゴリと、発話テキストの伝達要素それぞれとに対応する単語を特定する。そして、単語解析部130は、特定した単語を発話テキストから抽出する。なお、単語解析部130は、以前の会話情報および閲覧情報から伝達要素に対応する単語を補完してもよい。
The
単語解析部130は、ある伝達要素に対応する単語がいずれも発話テキストから抽出されなかった場合、当該伝達要素を発話テキストの欠落伝達要素として特定する。発話テキストの欠落伝達要素は、第1の実施の形態に示した第1欠落伝達要素の一例である。単語解析部130は、発話テキストの欠落伝達要素が特定された場合、欠落伝達要素情報115から、発話テキストの欠落伝達要素を要求するための単語(発話テキストの欠落伝達要素に対応する欠落単語)を特定する。
When no word corresponding to a certain communicative element is extracted from the spoken text, the
また、単語解析部130は、二回目以降の発話テキストから、発話テキストのカテゴリに対応する伝達要素それぞれに対応する単語を抽出する。そして、単語解析部130は、ある伝達要素に対応する単語がいずれも発話テキストおよび二回目以降の発話テキストから抽出されなかった場合、当該伝達要素を二回目以降の発話テキストの欠落伝達要素として特定する。二回目以降の発話テキストの欠落伝達要素は、第1の実施の形態に示した第2欠落伝達要素の一例である。単語解析部130は、二回目以降の発話テキストの欠落伝達要素が特定された場合、欠落伝達要素情報115から、二回目以降の発話テキストの欠落伝達要素に対応する欠落単語を特定する。
In addition, the
応答生成部140は、発話テキストに対する応答を生成し、出力する。例えば、応答生成部140は、定型文情報116から、発話テキストのカテゴリと発話テキストの意図と発話テキストの欠落伝達要素に対応する定型文を選択する。なお、発話テキストに基づいて選択された定型文は、第1の実施の形態に示した第1定型文の一例である。
The
そして、応答生成部140は、欠落単語および発話テキストに含まれる単語を、選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。なお、発話テキストに基づいて出力される応答は、第1の実施の形態に示した第1応答の一例である。
Then, the
また、応答生成部140は、二回目以降の発話テキストに対する応答を生成し、出力する。例えば、応答生成部140は、定型文情報116から、発話テキストのカテゴリと発話テキストの意図と二回目以降の発話テキストの欠落伝達要素に対応する定型文を選択する。なお、二回目以降の発話テキストに基づいて選択された定型文は、第1の実施の形態に示した第2定型文の一例である。
Also, the
そして、応答生成部140は、欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語を、選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。なお、二回目以降の発話テキストに基づいて出力される応答は、第1の実施の形態に示した第2応答の一例である。
Then, the
また、応答生成部140は、発話テキストの欠落伝達要素または二回目以降の発話テキストの欠落伝達要素が特定されなかった場合、定型文情報116から、欠落伝達要素なしに対応する定型文を選択する。応答生成部140は、発話テキストまたは二回目以降の発話テキストに含まれる単語を選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。
In addition, when the missing conveying element of the utterance text or the missing conveying element of the second and subsequent utterance texts is not specified, the
なお、図4に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。次に、記憶部110に記憶される情報について詳細に説明する。
The lines connecting the elements shown in FIG. 4 indicate part of the communication paths, and communication paths other than the illustrated communication paths can be set. Next, information stored in
図5は、カテゴリ情報の一例を示す図である。カテゴリ情報111は、カテゴリと単語との対応関係を示す。カテゴリ情報111は、No.、カテゴリA、カテゴリBおよび単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリAの項目およびカテゴリBの項目それぞれには、カテゴリ名が設定される。なお、カテゴリBの項目にカテゴリ名が設定されたカテゴリが、カテゴリAの項目にカテゴリ名が設定されたカテゴリを細分化したものであってもよい。単語の項目には、カテゴリに対応する単語が設定される。
FIG. 5 is a diagram showing an example of category information. The
一例として、カテゴリ情報111には、No.の項目に「0001」、カテゴリAの項目に「ファッション」、カテゴリBの項目に「洋服レディース」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「トップス」、「コート」、「ジャケット」、「スカート」および「ワンピース」が設定されている。識別番号「0001」のレコードは、「トップス」、「コート」、「ジャケット」、「スカート」および「ワンピース」のいずれかの単語が含まれるテキストが「ファッション」および「洋服レディース」のカテゴリに分類されることを示す。
As an example, the
図6は、意図情報の一例を示す図である。意図情報112は、意図と単語との対応関係を示す。意図情報112は、No.、意図、処理および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。意図の項目には、意図の名称が設定される。処理の項目には、意図に対する処理名が設定される。単語の項目には、意図に対応する単語が設定される。
FIG. 6 is a diagram showing an example of intention information. The
一例として、意図情報112には、No.の項目に「0001」、意図の項目に「検索」、処理の項目に「確認」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「調べて」、「検索して」および「おしえて」が設定されている。識別番号「0001」のレコードは、「調べて」、「検索して」および「おしえて」のいずれかの単語が含まれるテキストの意図が「検索」であることを示す。また、識別番号「0001」のレコードは、「検索」を意図とするテキストに対する処理として「確認」が適切であることを示す。
As an example, the
図7は、伝達要素情報の一例を示す図である。伝達要素情報113は、カテゴリと伝達要素との対応関係およびカテゴリと伝達要素との組み合わせと単語との対応関係を示す。伝達要素情報113は、No.、カテゴリ、伝達要素および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。単語の項目には、カテゴリと伝達要素との組み合わせに対応する単語が設定される。
FIG. 7 is a diagram showing an example of transfer element information. The
一例として、伝達要素情報113には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「月」、「上旬」、「中旬」、「下旬」、「誕生日」、「記念日」、「春」、「夏」、「秋」および「冬」が設定されている。識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素「いつ」に対応する単語が、「月」、「上旬」、「中旬」、「下旬」、「誕生日」、「記念日」、「春」、「夏」、「秋」および「冬」であることを示す。
As an example, the
図8は、類義語情報の一例を示す図である。類義語情報114には、伝達要素情報113に登録されている単語の類義語が登録されている。類義語情報114に、類義語として登録されている単語は、伝達要素情報113に登録されている単語としてあつかわれてもよい。類義語情報114は、No.、カテゴリ、伝達要素および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。単語の項目には、類義語の関係にある単語が設定される。
FIG. 8 is a diagram showing an example of synonym information. Synonyms of the words registered in the
一例として、類義語情報114には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「誕生日」および「記念日」が設定されている。識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素「いつ」に対応する単語である、「誕生日」および「記念日」が類義語の関係であることを示す。
As an example, the
図9は、欠落伝達要素情報の一例を示す図である。欠落伝達要素情報115は、欠落伝達要素を特定するための情報である。なお、図9において[]で囲まれた単語は、[]内の単語で示される種類に分類されるいずれかの単語を示す。欠落伝達要素情報115は、No.、カテゴリ、伝達要素、抽出単語、欠落伝達要素および欠落単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、カテゴリに対応するすべての伝達要素名が設定される。抽出単語の項目には、テキストから抽出された単語が設定される。欠落伝達要素の項目には、テキストから対応する単語が抽出されなかった欠落伝達要素名が設定される。欠落単語の項目には、欠落伝達要素に対応する欠落単語が設定される。
FIG. 9 is a diagram showing an example of missing transfer element information. The missing
一例として、欠落伝達要素情報115には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」、「どこ」、「だれ」および「なに」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの抽出単語の項目には、「彼氏」、「ディナー」および「洋服」が設定されている。また、識別番号「0001」のレコードの欠落伝達要素の項目には「いつ」、欠落単語の項目には「いつ頃」が設定されている。
As an example, the missing
識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素が、「いつ」、「どこ」、「だれ」および「なに」であることを示す。また、識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストから「彼氏」、「ディナー」および「洋服」が抽出された場合、当該テキストの欠落伝達要素が「いつ」であることを示す。また、識別番号「0001」のレコードは、欠落伝達要素「いつ」に対応する欠落単語が「いつ頃」であることを示す。 The record with the identification number “0001” indicates that the communication elements of the text in the “fashion” category are “when”, “where”, “who” and “what”. Also, the record with the identification number "0001" indicates that when "boyfriend", "dinner" and "clothes" are extracted from the text of the category "fashion", the missing communication element of the text is "when". indicates Also, the record with the identification number "0001" indicates that the missing word corresponding to the missing communication element "when" is "when".
図10は、定型文情報の一例を示す図である。定型文情報116は、カテゴリと意図と欠落伝達要素との組み合わせと、定型文との対応関係を示す。なお、図10において[]は、定型文の空欄を示す。定型文情報116は、No.、カテゴリ、意図、処理、欠落伝達要素および定型文の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。意図の項目には、意図の名称が設定される。処理の項目には、意図に対する処理名が設定される。欠落伝達要素の項目には、欠落伝達要素名が設定される。なお、欠落伝達要素の項目には、欠落伝達要素がないことをしめす「-」が設定されることがある。定型文の項目には、定型文が設定される。
FIG. 10 is a diagram showing an example of fixed phrase information. The fixed
一例として、定型文情報116には、No.の項目に「0001」、カテゴリの項目に「ファッション」、意図の項目に「検索」、処理の項目に「確認」、欠落伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの定型文の項目には、「[]は[]の予定ですか。」が設定されている。識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」、欠落伝達要素が「いつ」であるテキストに対する処理として「確認」が適切であることを示す。また、識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」、欠落伝達要素が「いつ」であるテキストに対する応答を作成するための定型文が「[]は[]の予定ですか。」であることを示す。
As an example, the fixed
図11は、アイテム情報の一例を示す図である。アイテム情報117は、テキスト内に含まれる単語から当該テキストと関連するアイテムを特定するための情報である。アイテム情報117は、No.、カテゴリ、伝達要素、意図、単語およびアイテムの項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。意図の項目には、意図の名称が設定される。単語の項目には、単語が設定される。アイテムの項目には、単語に関連するアイテムが設定される。
FIG. 11 is a diagram showing an example of item information. The
一例として、アイテム情報117には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「なに」、意図の項目に「検索」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「10月」、「11月」、「洋服」、「コート」、「ディナー」、「誕生日」および「懇談会」が設定されている。また、識別番号「0001」のレコードのアイテムの項目には、「トレンチコート」が設定されている。
As an example, the
識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」のテキストに、「10月」、「11月」、「洋服」、「コート」、「ディナー」、「誕生日」および「懇談会」のいずれかが含まれる場合、当該テキストと「トレンチコート」が関連することを示す。また、識別番号「0001」のレコードは、「トレンチコート」が伝達要素が「なに」に対応することを示す。 The record with the identification number "0001" has the text "fashion" as the category and "search" as the intent, and "October", "November", "clothes", "coat", "dinner", and "birthday". and "round-table", it indicates that the text and "trench coat" are related. Also, the record with the identification number "0001" indicates that "trench coat" corresponds to the transmission element "what".
以下、情報処理装置100が実行する処理の手順について、詳細に説明する。
図12は、応答処理の手順の一例を示すフローチャート(その1)である。以下、図12に示す処理をステップ番号に沿って説明する。
The procedure of the processing executed by the
FIG. 12 is a flowchart (part 1) illustrating an example of a procedure of response processing. The processing shown in FIG. 12 will be described below along with the step numbers.
[ステップS11]発話解析部120は、ユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。
[ステップS12]発話解析部120は、音声認識によってユーザ発話を示すテキスト(発話テキスト)を生成し、発話テキストに含まれる単語に分割をする。例えば、発話解析部120は、ステップS11で取得したユーザ20のユーザ発話を示す音声を音声認識によって発話テキストに変換する。そして、発話解析部120は、発話テキストを形態素解析によって単語に分割する。
[Step S11] The
[Step S12] The
[ステップS13]単語解析部130は、発話テキストのカテゴリおよび意図を特定する。例えば、単語解析部130は、カテゴリ情報111から、発話テキストに含まれる単語が単語の項目に設定されたレコードを特定する。そして、単語解析部130は、特定したレコードのカテゴリAおよびカテゴリBの項目に設定されたカテゴリを、発話テキストのカテゴリとして特定する。また、例えば、単語解析部130は、意図情報112から、発話テキストに含まれる単語が単語の項目に設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの意図の項目に設定された意図を、発話テキストの意図として特定する。なお、発話テキストに含まれる単語が単語の項目に設定されたレコードがカテゴリ情報111、意図情報112に複数登録されている場合、単語解析部130は、発話テキストに含まれる単語が、最も多く単語の項目に設定されたレコードを特定する。
[Step S13] The
[ステップS14]単語解析部130は、発話テキストのカテゴリを特定できたか否かを判定する。単語解析部130は、発話テキストのカテゴリを特定できたと判定した場合、処理をステップS15に進める。また、単語解析部130は、発話テキストのカテゴリを特定できなかったと判定した場合、処理を終了する。
[Step S14] The
[ステップS15]単語解析部130は、発話テキストの意図を特定できたか否かを判定する。単語解析部130は、発話テキストの意図を特定できたと判定した場合、処理をステップS16に進める。また、単語解析部130は、発話テキストの意図を特定できなかったと判定した場合、処理を終了する。
[Step S15] The
[ステップS16]単語解析部130は、欠落伝達要素があるか否かを判定する。例えば、単語解析部130は、欠落伝達要素情報115に登録されている、ステップS13で特定した発話テキストのカテゴリがカテゴリの項目に設定されたレコードの、伝達要素の項目に設定された伝達要素を特定する。単語解析部130は、伝達要素情報113から、カテゴリの項目に発話テキストのカテゴリが設定され、伝達要素の項目に欠落伝達要素情報115から特定された伝達要素のいずれかが設定されたレコードを抽出する。そして、単語解析部130は、抽出されたレコードのうち、単語の項目に発話テキストに含まれる単語が設定されていないレコードの伝達要素の項目に設定された伝達要素を発話テキストの欠落伝達要素として特定する。単語解析部130は、発話テキストの欠落伝達要素が特定された場合、欠落伝達要素があると判定し、発話テキストの欠落伝達要素が特定されなかった場合、欠落伝達要素がないと判定する。
[Step S16] The
単語解析部130は、欠落伝達要素があると判定した場合、処理をステップS17に進める。また、単語解析部130は、欠落伝達要素がないと判定した場合、処理をステップS32に進める。
When
[ステップS17]単語解析部130は、欠落伝達要素に対応する欠落単語を特定する。例えば、単語解析部130は、欠落伝達要素情報115から、カテゴリの項目に発話テキストのカテゴリが設定され、欠落伝達要素の項目に発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの欠落単語の項目に設定された単語を欠落伝達要素に対応する欠落単語として特定する。
[Step S17] The
[ステップS18]単語解析部130は、以前の会話情報および閲覧情報を取得する。例えば、単語解析部130は、応答処理の履歴からユーザ20との以前の会話情報を取得する。また、例えば、単語解析部130は、HTTP(Hyper Text Transfer Protocol)のメタ情報からユーザ20がインターネットにより閲覧したとPC200が判定したテキストやWeb表示されるタイトルを、PC200から取得する。
[Step S18] The
[ステップS19]単語解析部130は、以前の会話情報および閲覧情報を単語に分割する。例えば、単語解析部130は、ステップS18で取得したテキストを形態素解析によって単語に分割する。
[Step S19] The
[ステップS20]単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があるか否かを判定する。例えば、単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、伝達要素情報113の単語の項目に発話テキストに含まれる単語が設定されていないレコード(欠落伝達要素に対応するレコード)の単語の項目に設定されているか否かを判定する。単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、欠落伝達要素に対応するレコードの単語の項目に設定されている場合、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があると判定する。また、単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、欠落伝達要素に対応するレコードの単語の項目に設定されていない場合、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語がないと判定する。
[Step S20] The
単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があると判定した場合、処理をステップS21に進める。また、単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語がないと判定した場合、処理をステップS22に進める。
When
[ステップS21]単語解析部130は、以前の会話情報および閲覧情報に含まれる単語によって、欠落伝達要素に対応する単語を補完する。例えば、単語解析部130は、応答生成部140に、以前の会話情報および閲覧情報に含まれる単語のうち、ステップS20で特定した欠落伝達要素に対応する単語を、発話テキストに含まれる単語と同様にあつかわせる。そして、処理がステップS32に進む。
[Step S21] The
図13は、応答処理の手順の一例を示すフローチャート(その2)である。以下、図13に示す処理をステップ番号に沿って説明する。
[ステップS22]応答生成部140は、発話テキストの欠落伝達要素に対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。
FIG. 13 is a flowchart (part 2) showing an example of the procedure of response processing. The processing shown in FIG. 13 will be described below along with the step numbers.
[Step S22] The
[ステップS23]応答生成部140は、定型文、欠落単語および発話テキストに含まれる単語(抽出単語)から応答を生成し、出力する。例えば、応答生成部140は、ステップS22で選択された定型文の空欄に、ステップS17で特定された欠落単語および発話テキストに含まれる単語を入れて応答テキストを生成する。なお、定型文の空欄それぞれには伝達要素が設定されていてもよく、応答生成部140は、ステップS17で特定された欠落単語および発話テキストに含まれる単語のうち、空欄に設定された伝達要素に対応する単語を各空欄に入れてもよい。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。
[Step S23] The
[ステップS24]発話解析部120は、一定期間内に次のユーザ発話を取得したか否かを判定する。発話解析部120は、一定期間内に次のユーザ発話を取得したと判定した場合、処理をステップS26に進める。また、発話解析部120は、一定期間内に次のユーザ発話を取得しなかったと判定した場合、処理をステップS25に進める。
[Step S24] The
[ステップS25]応答生成部140は、再発話処理をする。例えば、応答生成部140は、ユーザ20に発話を促すテキスト(例えば、「よく聞き取れなかった・・・。」)をPC200に送信し、送信したテキストを示す音声をPC200に出力させる。そして、処理が終了する。
[Step S25] The
[ステップS26]発話解析部120は、二回目以降のユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。
[ステップS27]発話解析部120は、音声認識によって二回目以降のユーザ発話を示すテキスト(二回目以降の発話テキスト)を生成し、二回目以降の発話テキストに含まれる単語に分割をする。例えば、発話解析部120は、ステップS26で取得したユーザ20のユーザ発話を示す音声を音声認識によって二回目以降の発話テキストに変換する。そして、発話解析部120は、二回目以降の発話テキストを形態素解析によって単語に分割する。
[Step S26] The
[Step S27] The
[ステップS28]単語解析部130は、欠落伝達要素があるか否かを判定する。単語解析部130は、伝達要素情報113から、カテゴリの項目に発話テキストのカテゴリが設定され、伝達要素の項目に欠落伝達要素情報115から特定された伝達要素のいずれかが設定されたレコードを抽出する。単語解析部130は、抽出されたレコードのうち、単語の項目に発話テキストおよび二回目以降の発話テキストに含まれる単語が設定されていないレコードの、伝達要素の項目に設定された伝達要素を二回目以降の発話テキストの欠落伝達要素として特定する。単語解析部130は、二回目以降の発話テキストの欠落伝達要素が特定された場合、欠落伝達要素があると判定し、二回目以降の発話テキストの欠落伝達要素が特定されなかった場合、欠落伝達要素がないと判定する。
[Step S28] The
単語解析部130は、欠落伝達要素があると判定した場合、処理をステップS29に進める。また、単語解析部130は、欠落伝達要素がないと判定した場合、処理をステップS32に進める。
When
[ステップS29]単語解析部130は、欠落伝達要素に対応する欠落単語を特定する。例えば、単語解析部130は、欠落伝達要素情報115から、カテゴリの項目に発話テキストのカテゴリが設定され、欠落伝達要素の項目に二回目以降の発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの欠落単語の項目に設定された単語を欠落伝達要素に対応する欠落単語として特定する。
[Step S29] The
[ステップS30]応答生成部140は、発話テキストの欠落伝達要素に対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に二回目以降の発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。
[Step S30] The
[ステップS31]応答生成部140は、定型文、欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語(抽出単語)から二回目以降の応答を生成し、出力する。例えば、応答生成部140は、ステップS30で選択された定型文の空欄に、ステップS29で特定された欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語を入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。そして、処理がステップS24に進む。
[Step S31] The
[ステップS32]応答生成部140は、欠落伝達要素なしに対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に「-」が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。
[Step S32] The
[ステップS33]応答生成部140は、定型文、発話テキストまたは二回目以降の発話テキストに含まれる単語(抽出単語)から応答を生成し、出力する。例えば、応答生成部140は、ステップS32で選択された定型文の空欄に、発話テキストまたは二回目以降の発話テキストに含まれる単語を入れて応答テキストを生成する。なお、応答生成部140は、アイテム情報117から特定されるアイテムを定型文の空欄に入れてもよい。発話テキストまたは二回目以降の発話テキストと関連する応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。
[Step S33] The
このように、応答生成部140は、発話テキストのカテゴリと発話テキストの意図と発話テキストの欠落伝達要素に対応する定型文を選択する。そして、応答生成部140は、欠落単語および発話テキストに含まれる単語を選択した定型文の空欄に入れて応答テキストを生成する。これにより、応答生成部140は、自然な対話によって、ユーザ20に欠落伝達要素に対応する単語を要求できる。よって、応答生成部140は、円滑な対話ができるシステムを実現することができる。また、応答生成部140は、ユーザ20が発話した意図に合わせた応答ができる。
In this way, the
また、単語解析部130は、発話テキストに含まれる単語から発話テキストのカテゴリを特定する。これにより、単語解析部130は、対話のカテゴリによって変動することがある伝達要素を正確に特定できる。よって、応答生成部140は、正確な欠落伝達要素に対応する単語をユーザ20に要求できる。
The
なお、二回目以降の発話テキストは、応答生成部140が出力した応答に対するユーザ20の応答であるため、対話全体のカテゴリを特定できないことが多い。応答生成部140は、発話テキストのカテゴリに基づいた伝達要素のうちの、二回目以降の発話テキストの欠落伝達要素に基づいて定型文を選択することで、適切に二回目以降の応答を生成することができる。よって、応答生成部140は、ユーザ20と複数回のやりとりがある場合も欠落伝達要素をユーザ20に自然に要求できる。
Note that since the second and subsequent utterance texts are the responses of the user 20 to the responses output by the
次に、情報処理装置100が実行する処理の具体例について説明する。
図14は、情報処理装置とユーザとの対話の一例を示す図(その1)である。図14の例では、発話解析部120がユーザ20のユーザ発話を音声認識によって発話テキスト51に変換したものとする。発話テキスト51は、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」というテキストである。発話解析部120は、発話テキスト51を「彼氏」、「と」、「ディナー」、「に」、「着て」、「いく」、「おしゃれ」、「な」、「洋服」、「を」、「調べて」、「なるべく」、「安く」および「て」に単語分割する。
Next, a specific example of processing executed by the
FIG. 14 is a diagram (part 1) illustrating an example of interaction between the information processing apparatus and the user; In the example of FIG. 14, the
次に、単語解析部130は、発話テキスト51に含まれる単語とカテゴリ情報111とから、発話テキスト51のカテゴリを特定する。まず、単語解析部130は、カテゴリ情報111の、「彼氏」、「ディナー」、「おしゃれ」および「洋服」が単語の項目に設定されているレコードを参照する。そして、単語解析部130は、参照したレコードのカテゴリAおよびカテゴリBの項目に設定されている、「ファッション」および「提案」を発話テキスト51のカテゴリとして特定する。
Next, the
また、単語解析部130は、発話テキスト51に含まれる単語と意図情報112とから、発話テキスト51の意図を特定する。まず、単語解析部130は、意図情報112の、「調べて」が単語の項目に設定されているレコードを参照する。そして、単語解析部130は、参照したレコードの意図の項目に設定されている、「検索」を発話テキスト51のカテゴリとして特定する。
The
次に、単語解析部130は、発話テキスト51の欠落伝達要素と、発話テキスト51の欠落伝達要素に対応する欠落単語を特定する。まず、単語解析部130は、欠落伝達要素情報115の、「ファッション」がカテゴリの項目に設定されているレコードを参照する。単語解析部130は、参照したレコードの伝達要素の項目に設定された、「いつ」、「どこ」、「だれ」および「なに」をカテゴリ「ファッション」に対応する伝達要素として特定する。単語解析部130は、伝達要素情報113の、カテゴリの項目に「ファッション」が設定され、伝達要素の項目に「いつ」、「どこ」、「だれ」および「なに」のいずれかが設定されたレコードを抽出する。
Next, the
ここで、抽出したレコードのうち、伝達要素の項目に「どこ」が設定されているレコードの単語の項目には、「ディナー」が設定され、伝達要素の項目に「だれ」が設定されているレコードの単語の項目には、「彼氏」が設定されている。また、抽出したレコードのうち、伝達要素の項目に「なに」が設定されているレコードの単語の項目には、「洋服」が設定され、伝達要素の項目に「いつ」が設定されているレコードの単語の項目には、発話テキスト51に含まれる単語が設定されていない。よって、単語解析部130は、「いつ」を発話テキスト51の欠落伝達要素として特定する。そして、単語解析部130は、欠落伝達要素情報115の、カテゴリの項目に「ファッション」が設定され、欠落伝達要素の項目に「いつ」が設定されたレコードの欠落単語の項目に設定された「いつ頃」を、欠落単語として特定する。
Here, among the extracted records, the word field of the record for which "where" is set in the communication element field is set to "dinner", and "who" is set in the communication element field. "Boyfriend" is set in the word field of the record. In addition, among the extracted records, the word item of the record in which "what" is set in the communication element item is set to "clothes", and the communication element item is set to "when". The word included in the spoken
次に、応答生成部140は、発話テキスト51の欠落伝達要素「いつ」に対応する定型文を選択する。応答生成部140は、定型文情報116から、カテゴリの項目に「ファッション」が設定され、意図の項目に「検索」が設定され、欠落伝達要素の項目に「いつ」が設定されたレコードの定型文の項目に設定された定型文「[]は[]の予定ですか。」を選択する。
Next, the
そして、応答生成部140は、定型文「[]は[]の予定ですか。」の空欄に、欠落単語および発話テキスト51に含まれる単語を入れて応答テキストを生成する。ここで、定型文「[]は[]の予定ですか。」の1つ目の空欄には伝達要素「どこ」が設定され、2つ目の空欄には、伝達要素「いつ」が設定されているものとする。応答生成部140は、定型文「[]は[]の予定ですか。」の1つ目の空欄に、伝達要素「どこ」に対応する「ディナー」を入れ、2つ目の空欄に欠落伝達要素「いつ」に対応する欠落単語「いつ頃」を入れ、応答テキスト52を生成する。応答テキスト52は、「ディナーはいつ頃の予定ですか。」というテキストである。応答生成部140は、応答テキスト52をPC200に送信し、応答テキスト52を示す音声をPC200に出力させる。
Then, the
図15は、情報処理装置とユーザとの対話の一例を示す図(その2)である。図15の例では、応答テキスト52に対するユーザ20のユーザ発話を、発話解析部120が発話テキスト53に変換したものとする。発話テキスト53は、「今月の30日、私の誕生日だよ。」というテキストである。発話解析部120は、発話テキスト53を「今月」、「の」、「30日」、「私」、「の」、「誕生日」および「だよ」に単語分割する。
FIG. 15 is a diagram (part 2) illustrating an example of interaction between the information processing apparatus and the user. In the example of FIG. 15, it is assumed that the user utterance of the user 20 to the
次に、単語解析部130は、発話テキスト53の欠落伝達要素と、発話テキスト53の欠落伝達要素に対応する欠落単語を特定する。ここで、伝達要素情報113の、カテゴリの項目に「ファッション」が設定され、伝達要素の項目に「いつ」が設定されたレコードの単語の項目には発話テキスト53に含まれる「誕生日」が設定されている。よって、単語解析部130は、カテゴリ「ファッション」について欠落伝達要素がないことを特定する。そして、単語解析部130は、カテゴリ「提案」について欠落伝達要素を特定する。
Next, the
単語解析部130は、欠落伝達要素情報115を参照し、「どこ」および「いくら」をカテゴリ「提案」に対応する伝達要素として特定する。ここで、伝達要素情報113には、「どこ」に対応する単語として発話テキスト51に含まれる「おしゃれ」が登録され、「いくら」に対応する単語として発話テキスト51,53に含まれる単語が登録されていない。すると、単語解析部130は、「いくら」を発話テキスト53の欠落伝達要素として特定する。そして、単語解析部130は、欠落伝達要素情報115を参照し、カテゴリ「提案」、欠落伝達要素「いくら」に対応する「予算」を欠落単語として特定する。
The
次に、応答生成部140は、定型文情報116から、カテゴリ「提案」、意図「検索」欠落伝達要素「いくら」に対応する定型文「どれくらいの[]ですか。」を選択する。ここで、定型文「どれくらいの[]ですか。」の空欄には伝達要素「いくら」が設定されているものとする。応答生成部140は、定型文「どれくらいの[]ですか。」の空欄に欠落伝達要素「いくら」に対応する欠落単語「予算」を入れ、応答テキスト54を生成する。応答テキスト54は、「どれくらいの予算ですか。」というテキストである。応答生成部140は、応答テキスト54をPC200に送信し、応答テキスト54を示す音声をPC200に出力させる。
Next, the
図16は、情報処理装置とユーザとの対話の一例を示す図(その3)である。図16の例では、応答テキスト54に対するユーザ20のユーザ発話を、発話解析部120が発話テキスト55に変換したものとする。発話テキスト55は、「20000円以内です。」というテキストである。発話解析部120は、発話テキスト55を「20000」、「円」、「以内」および「です」に単語分割する。
FIG. 16 is a diagram (part 3) illustrating an example of interaction between the information processing apparatus and the user. In the example of FIG. 16, it is assumed that the user utterance of the user 20 to the
ここで、伝達要素情報113には、カテゴリ「提案」、伝達要素「いくら」に対応する単語として、発話テキスト55に含まれる「円」が登録されている。よって、単語解析部130は、カテゴリ「提案」について欠落伝達要素がないことを特定する。これにより、単語解析部130は、カテゴリ「ファッション」および「提案」のいずれについても欠落伝達要素がないことを特定する。なお、単語解析部130は、カテゴリ「ファッション」の伝達要素「いつ」に対応する単語を、発話テキスト53に含まれる「今月」および「30日」から、「10月30日」に変換してもよい。また、単語解析部130は、カテゴリ「提案」の伝達要素「いくら」に対応する単語を、発話テキスト55に含まれる「円」および「円」の前にある数字である「20000」から、「20000円」に変換してもよい。
Here, in the
次に、応答生成部140は、定型文情報116から、カテゴリ「ファッション」、意図「検索」欠落伝達要素「-」(つまり、欠落伝達要素なし)に対応する定型文「[]は[]です。[]な[]はいかがでしょうか。」を選択する。ここで、定型文「[]は[]です。[]な[]はいかがでしょうか。」の1つ目の空欄には伝達要素「いつ」が設定され、2つ目の空欄には伝達要素「いつ」に関連する単語が設定されているものとする。また、定型文「[]は[]です。[]な[]はいかがでしょうか。」の3つ目の空欄にはカテゴリ「提案」の伝達要素「どこ」が設定され、4つ目の空欄には発話テキストに関連するアイテムが設定されているものとする。
Next, the
応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の1つ目の空欄に伝達要素「いつ」に対応する「10月30日」を入れる。また、応答生成部140は、例えば、日付と単語との対応関係を示すデータベースから、「10月30日」に関連する単語「肌寒い」を特定し、「肌寒い」を定型文「[]は[]です。[]な[]はいかがでしょうか。」の2つ目の空欄に入れる。また、応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の3つ目の空欄にカテゴリ「提案」の伝達要素「どこ」に対応する「おしゃれ」を入れる。また、応答生成部140は、アイテム情報117の単語の項目に、発話テキスト51,53,55に含まれる単語を最も多く含むレコードのアイテムの項目に設定されているアイテムを特定する。これにより、応答生成部140は、アイテム「トレンチコート」を特定する。応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の4つ目の空欄に「トレンチコート」を入れて、応答テキスト56を生成する。応答テキスト56は、「10月30日は肌寒いです。おしゃれなトレンチコートはいかがですか。」というテキストである。応答生成部140は、応答テキスト56をPC200に送信し、応答テキスト56を示す音声をPC200に出力させる。
The
なお、定型文「[]は[]です。[]な[]はいかがでしょうか。」には、検索処理が対応付けられていてもよい。そして、応答生成部140は、PC200に、伝達要素「いくら」に対応する「20000円」およびアイテム「トレンチコート」を用いたインターネット検索を実行させ、検索結果を表示させてもよい。
It should be noted that search processing may be associated with the fixed phrase "[] is []. How about [] and []?". Then,
図17は、情報処理装置とユーザとの対話の流れの一例を示す図である。発話解析部120は、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」という発話テキスト51を取得する。ここで、発話テキスト51には、伝達要素「いつ」および「いくら」に対応する単語が含まれていないため、ユーザ20の要求を満たす応答が困難である。
FIG. 17 is a diagram illustrating an example of the flow of dialogue between the information processing device and the user. The
そこで、応答生成部140は、「ディナーはいつ頃の予定ですか。」という応答テキスト52を出力することで、ユーザ20に伝達要素「いつ」に対応する単語を要求することができる。そして、発話解析部120は、「今月の30日、私の誕生日だよ。」という発話テキスト53を取得する。単語解析部130は、発話テキスト53から伝達要素「いつ」に対応する「10月30日」を特定できる。
Therefore, the
また、応答生成部140は、「どれくらいの予算ですか。」という応答テキスト54を出力することで、ユーザ20に伝達要素「いくら」に対応する単語を要求することができる。そして、発話解析部120は、「20000円以内です。」という発話テキスト55を取得する。単語解析部130は、発話テキスト55から伝達要素「いくら」に対応する「20000円」を特定できる。
Also, the
そして、応答生成部140は、「10月30日は肌寒いです。おしゃれなトレンチコートはいかがですか。」という応答テキスト56を出力する。このように、応答生成部140は、応答テキスト52,54により欠落伝達要素に対応する単語をユーザ20に要求することで、ユーザ20の要求を満たすことが可能な発話テキスト51に対する応答である応答テキスト56を出力できる。
Then, the
第2の実施の形態によれば、情報処理装置100の単語解析部130は、発話テキストから伝達要素それぞれに対応する単語を抽出する。情報処理装置100の応答生成部140は、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択する。そして、応答生成部140は、発話テキストに含まれる単語と定型文とに基づいた応答を出力する。
According to the second embodiment, the
これにより、情報処理装置100は、自然なやりとりによって欠落伝達要素に対応する単語をユーザ20に要求できる。よって、情報処理装置100は、円滑な対話ができるシステムを実現することができる。
Accordingly, the
また、単語解析部130は、発話テキストに含まれる単語からカテゴリを特定し、カテゴリに対応する伝達要素のうちの欠落伝達要素に基づいて定型文を選択する。これにより、情報処理装置100は、正確な欠落伝達要素に対応する単語をユーザ20に要求できる。
Further,
また、単語解析部130は、発話テキストに含まれる単語からカテゴリを特定する。応答生成部140は、伝達要素のうちの対応する単語が発話テキストから抽出されなかった発話テキストの欠落伝達要素に基づいて定型文を選択し、発話テキストに含まれる単語と定型文とに基づいた応答を出力する。応答生成部140は、二回目以降の発話テキストを取得すると、伝達要素のうちの対応する単語が発話テキストと二回目以降の発話テキストとから抽出されなかった二回目以降の発話テキストの欠落伝達要素に基づいて定型文を選択する。応答生成部140は、発話テキストに含まれる単語と二回目以降の発話テキストに含まれる単語と定型文とに基づいた応答を出力する。これにより、情報処理装置100は、ユーザ20と複数回のやりとりがある場合も欠落伝達要素をユーザ20に自然に要求できる。
In addition, the
また、単語解析部130は、発話テキストに含まれる単語から意図を特定し、欠落伝達要素と意図とに基づいて定型文を選択する。これにより、情報処理装置100は、ユーザ20が発話した意図に合わせた応答ができる。
The
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。 Although the embodiment has been exemplified above, the configuration of each part shown in the embodiment can be replaced with another one having the same function. Also, any other components or steps may be added. Furthermore, any two or more configurations (features) of the above-described embodiments may be combined.
1 入力文
2 応答
10 情報処理装置
11 処理部
1 input sentence 2
Claims (4)
を有する情報処理装置。 A plurality of categories are identified from words contained in a sentence input by a user, and each of the plurality of categories is identified from the input sentence, conversation information that is a history of response processing to the user, and browsing information of the user on the Internet. extracting words corresponding to each of the conveying elements of the input sentence, selecting fixed sentences of each of the plurality of categories based on the missing conveying elements for which the corresponding words are not extracted among the conveying elements, and included in the input sentence a processing unit that outputs a response based on the words contained in the conversation information, the words contained in the conversation information, the words contained in the browsing information, and the fixed phrases;
Information processing device having
請求項1記載の情報処理装置。 The processing unit specifies the plurality of categories from words included in a first input sentence from the user, and the corresponding words among the transfer elements correspond to the first input sentence, the conversation information, and the browsing information. selects a first fixed form sentence based on the first missing transfer element not extracted from the input sentence, the word contained in the conversation information, the word contained in the browsing information, and the first fixed form sentence outputting a first response based on a standard sentence and obtaining a second input sentence from the user, the corresponding words in the transfer elements are the first input sentence, the second input sentence, and the conversation information; selects a second fixed form sentence based on the second missing communication element not extracted from the browsing information and the words contained in the first input sentence, the words contained in the second input sentence, and the conversation information; outputting a second response based on the included words, the words included in the browsing information, and the second fixed phrase;
The information processing apparatus according to claim 1 .
請求項1または2記載の情報処理装置。 The processing unit identifies an intention from words included in the input sentence, and selects the fixed form sentence based on the missing communication element and the intention.
3. The information processing apparatus according to claim 1 or 2 .
ユーザからの入力文に含まれる単語から複数のカテゴリを特定し、
前記入力文と、前記ユーザに対する応答処理の履歴である会話情報と、前記ユーザのインターネットによる閲覧情報とから、前記複数のカテゴリそれぞれの伝達要素それぞれに対応する単語を抽出し、
前記伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて、前記複数のカテゴリそれぞれの定型文を選択し、
前記入力文に含まれる単語と前記会話情報に含まれる単語と前記閲覧情報に含まれる単語と前記定型文とに基づいた応答を出力する、
処理を実行させるプログラム。 to the computer,
Identify multiple categories from the words contained in the input sentence from the user,
Extracting words corresponding to each of the communication elements of each of the plurality of categories from the input sentence, conversation information that is a history of response processing to the user, and the user's browsing information on the Internet,
Selecting fixed phrases for each of the plurality of categories based on missing communicating elements for which corresponding words have not been extracted from the communicating elements;
outputting a response based on the words included in the input sentence, the words included in the conversation information, the words included in the browsing information, and the fixed sentences;
A program that causes an action to take place.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021097444A JP7295445B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021097444A JP7295445B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022189081A JP2022189081A (en) | 2022-12-22 |
JP7295445B2 true JP7295445B2 (en) | 2023-06-21 |
Family
ID=84532738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021097444A Active JP7295445B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7295445B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117923A (en) | 1999-10-21 | 2001-04-27 | Cai Kk | Natural word interactive system for computer |
JP2005301780A (en) | 2004-04-14 | 2005-10-27 | Sony Corp | Information processor, information processing method, and program |
JP2015069101A (en) | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2015069103A (en) | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2021018797A (en) | 2019-07-23 | 2021-02-15 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Conversation interaction method, apparatus, computer readable storage medium, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08255150A (en) * | 1995-03-17 | 1996-10-01 | Toshiba Corp | Information public offering device and multimodal information input/output system |
JP6163143B2 (en) * | 2014-08-06 | 2017-07-12 | 日本電信電話株式会社 | Information providing apparatus, information providing method, and information providing program |
JP7174551B2 (en) * | 2018-07-23 | 2022-11-17 | ヤフー株式会社 | Estimation device, estimation method and estimation program |
JP6868175B1 (en) * | 2020-03-26 | 2021-05-12 | 株式会社鈴康 | Programs, information processing methods and information processing systems |
-
2021
- 2021-06-10 JP JP2021097444A patent/JP7295445B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001117923A (en) | 1999-10-21 | 2001-04-27 | Cai Kk | Natural word interactive system for computer |
JP2005301780A (en) | 2004-04-14 | 2005-10-27 | Sony Corp | Information processor, information processing method, and program |
JP2015069101A (en) | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2015069103A (en) | 2013-09-30 | 2015-04-13 | Necパーソナルコンピュータ株式会社 | Information processing device, control method, and program |
JP2021018797A (en) | 2019-07-23 | 2021-02-15 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Conversation interaction method, apparatus, computer readable storage medium, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2022189081A (en) | 2022-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7498149B2 (en) | User Programmable Automated Assistant | |
JP6993466B2 (en) | Providing suggested voice-based action queries | |
US20210132986A1 (en) | Back-end task fulfillment for dialog-driven applications | |
CN111033492B (en) | Providing command bundle suggestions for automated assistants | |
US10331791B2 (en) | Service for developing dialog-driven applications | |
US20180285595A1 (en) | Virtual agent for the retrieval and analysis of information | |
US9081411B2 (en) | Rapid development of virtual personal assistant applications | |
US8892419B2 (en) | System and methods for semiautomatic generation and tuning of natural language interaction applications | |
US20140337266A1 (en) | Rapid development of virtual personal assistant applications | |
CN113468302A (en) | Combining parameters of multiple search queries sharing an interrogation line | |
JP2008090545A (en) | Voice interaction device and method | |
KR20080017414A (en) | Dynamic user experience with semantic rich objects | |
JP2009528621A (en) | Adaptive semantic platform architecture | |
US20230244855A1 (en) | System and Method for Automatic Summarization in Interlocutor Turn-Based Electronic Conversational Flow | |
KR20160147303A (en) | Method for dialog management based on multi-user using memory capacity and apparatus for performing the method | |
Remael et al. | From translation studies and audiovisual translation to media accessibility: Some research trends | |
WO2016040402A1 (en) | Actions on digital document elements from voice | |
JP2020135135A (en) | Dialog content creation assisting method and system | |
JP2023539232A (en) | Conversational syntax using constrained natural language processing to access datasets | |
JP2007183796A (en) | Business evaluation value calculation system | |
JP7295445B2 (en) | Information processing device and program | |
WO2020121638A1 (en) | Information processing device, information processing system, information processing method, and program | |
US20220207066A1 (en) | System and method for self-generated entity-specific bot | |
JP2020161012A (en) | Information processing apparatus, control method and program | |
CN118202344A (en) | Deep learning technique for extracting embedded data from documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230301 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230301 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230307 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7295445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |