JP7295445B2 - Information processing device and program - Google Patents

Information processing device and program Download PDF

Info

Publication number
JP7295445B2
JP7295445B2 JP2021097444A JP2021097444A JP7295445B2 JP 7295445 B2 JP7295445 B2 JP 7295445B2 JP 2021097444 A JP2021097444 A JP 2021097444A JP 2021097444 A JP2021097444 A JP 2021097444A JP 7295445 B2 JP7295445 B2 JP 7295445B2
Authority
JP
Japan
Prior art keywords
information
missing
words
text
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021097444A
Other languages
Japanese (ja)
Other versions
JP2022189081A (en
Inventor
敏郎 大櫃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Client Computing Ltd
Original Assignee
Fujitsu Client Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Client Computing Ltd filed Critical Fujitsu Client Computing Ltd
Priority to JP2021097444A priority Critical patent/JP7295445B2/en
Publication of JP2022189081A publication Critical patent/JP2022189081A/en
Application granted granted Critical
Publication of JP7295445B2 publication Critical patent/JP7295445B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置およびプログラムに関する。 The present invention relates to an information processing device and program.

近年、ユーザと対話する対話システムが普及している。対話システムは、ユーザが入力した音声やテキストに応じた処理をする。例えば、ユーザが行いたい作業を対話システムに伝えると、対話システムは作業に対応するソフトウェアを起動する。また、例えば、対話システムは、ユーザの質問内容に応じた応答を出力する。 2. Description of the Related Art In recent years, interactive systems that interact with users have become widespread. A dialog system performs processing according to voice or text input by a user. For example, when the user tells the dialog system what he or she wants to do, the dialog system activates the software corresponding to the task. Also, for example, the dialogue system outputs a response according to the contents of the user's question.

対話システムに関する技術としては、例えば、電子デバイスの多くの異なるサービスに関するユーザの体験を統一、簡略化及び改善できるインテリジェント自動アシスタントが提案されている。また、例えば、ダイアログ・システム・インテントおよび1つまたは複数の要求されたパラメータに基づいて、アクション命令を生成するダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成が提案されている。 Technologies related to interactive systems, for example, have proposed intelligent automated assistants that can unify, simplify, and improve the user's experience with many different services on electronic devices. Also proposed is parameter collection and automatic dialog generation in a dialog system that generates action instructions based on, for example, a dialog system intent and one or more requested parameters.

特開2020-173835号公報JP 2020-173835 A 特表2019-503526号公報Japanese Patent Publication No. 2019-503526

対話システムは、あらかじめ設定されている要素それぞれに対応する単語がユーザが入力したテキストにすべて含まれている場合、適切な応答ができることが多い。そこで、不足した要素についての選択入力をユーザから受け付け、受け付けた入力内容を踏まえて応答することが考えられる。しかし、ユーザに選択入力を要求するような場合、円滑な対話ができなくなる。 Dialog systems are often able to respond appropriately when the text entered by the user contains all the words corresponding to each of the preset elements. Therefore, it is conceivable to receive a selection input for the missing element from the user and respond based on the received input content. However, when the user is requested to input a selection, smooth interaction cannot be achieved.

1つの側面では、本件は、円滑な対話ができるシステムを実現することを目的とする。 In one aspect, the object of the present invention is to realize a system capable of smooth dialogue.

1つの案では、処理部を有する情報処理装置が提供される。処理部は、入力文から伝達要素それぞれに対応する単語を抽出し、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択し、入力文に含まれる単語と定型文とに基づいた応答を出力する。 One proposal provides an information processing apparatus having a processing unit. The processing unit extracts words corresponding to each of the conveying elements from the input sentence, selects fixed phrases based on the missing conveying elements from the conveying elements for which the corresponding words are not extracted, and extracts the words included in the input sentence and Output responses based on fixed phrases.

1態様によれば、円滑な対話ができるシステムを実現することができる。 According to one aspect, it is possible to realize a system capable of smooth dialogue.

第1の実施の形態に係る情報処理装置の一例を示す図である。1 illustrates an example of an information processing apparatus according to a first embodiment; FIG. 第2の実施の形態に係る情報処理システムの一例を示す図である。It is a figure which shows an example of the information processing system which concerns on 2nd Embodiment. 情報処理装置のハードウェアの一構成例を示す図である。It is a figure which shows one structural example of the hardware of an information processing apparatus. 情報処理装置の機能例を示すブロック図である。2 is a block diagram showing an example of functions of an information processing device; FIG. カテゴリ情報の一例を示す図である。It is a figure which shows an example of category information. 意図情報の一例を示す図である。It is a figure which shows an example of intention information. 伝達要素情報の一例を示す図である。It is a figure which shows an example of transmission element information. 類義語情報の一例を示す図である。It is a figure which shows an example of synonym information. 欠落伝達要素情報の一例を示す図である。It is a figure which shows an example of missing transfer element information. 定型文情報の一例を示す図である。It is a figure which shows an example of fixed phrase information. アイテム情報の一例を示す図である。It is a figure which shows an example of item information. 応答処理の手順の一例を示すフローチャート(その1)である。FIG. 11 is a flowchart (part 1) showing an example of a procedure of response processing; FIG. 応答処理の手順の一例を示すフローチャート(その2)である。FIG. 11 is a flowchart (part 2) showing an example of a procedure of response processing; FIG. 情報処理装置とユーザとの対話の一例を示す図(その1)である。FIG. 1 is a diagram (part 1) showing an example of interaction between an information processing apparatus and a user; 情報処理装置とユーザとの対話の一例を示す図(その2)である。FIG. 2 is a diagram (part 2) showing an example of interaction between an information processing apparatus and a user; 情報処理装置とユーザとの対話の一例を示す図(その3)である。FIG. 3 is a diagram (part 3) showing an example of interaction between an information processing apparatus and a user; 情報処理装置とユーザとの対話の流れの一例を示す図である。FIG. 3 is a diagram showing an example of the flow of dialogue between an information processing device and a user;

以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る情報処理装置の一例を示す図である。第1の実施の形態は、情報処理装置10が入力文1に対する自然な応答2を出力するものである。
Hereinafter, this embodiment will be described with reference to the drawings. It should be noted that each embodiment can be implemented by combining a plurality of embodiments within a consistent range.
[First embodiment]
1 is a diagram illustrating an example of an information processing apparatus according to a first embodiment; FIG. In the first embodiment, an information processing apparatus 10 outputs a natural response 2 to an input sentence 1. FIG.

情報処理装置10は、対話システムを提供するコンピュータである。情報処理装置10は、サーバコンピュータであってもよいし、クライアントコンピュータであってもよい。情報処理装置10は、処理部11を有する。処理部11は、情報処理装置10を制御し、所要の処理を実行可能である。処理部11は、例えば、情報処理装置10が有するプロセッサ、または演算回路である。 The information processing device 10 is a computer that provides an interactive system. The information processing apparatus 10 may be a server computer or a client computer. The information processing device 10 has a processing unit 11 . The processing unit 11 can control the information processing device 10 and execute required processing. The processing unit 11 is, for example, a processor or an arithmetic circuit included in the information processing device 10 .

まず、処理部11は、入力文1を取得する。入力文1は、ユーザから入力されたテキストである。入力文1は、音声入力されたユーザの発話を音声認識によってテキストとしたものであってもよいし、ユーザがテキスト入力によって入力したテキストであってもよい。入力文1は、一例として、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」というテキストである。 First, the processing unit 11 acquires the input sentence 1 . The input sentence 1 is text input by the user. The input sentence 1 may be a text obtained by speech recognition of the user's voice-inputted utterance, or may be a text input by the user through text input. Input sentence 1 is, for example, a text that reads, "Look for fashionable clothes to wear to dinner with your boyfriend, and find them as cheap as possible."

次に、処理部11は、入力文1に含まれる単語からカテゴリを特定する。例えば、処理部11は、複数のカテゴリそれぞれに対応する単語を示す情報を参照する。そして、処理部11は、対応する単語が入力文1に最も多く含まれるカテゴリを入力文1のカテゴリとして特定する。一例として、処理部11は、入力文1に含まれる「彼氏」、「ディナー」、「おしゃれ」および「洋服」から、入力文1のカテゴリをファッションと特定する。 Next, the processing unit 11 identifies categories from the words included in the input sentence 1 . For example, the processing unit 11 refers to information indicating words corresponding to each of a plurality of categories. Then, the processing unit 11 identifies the category in which the input sentence 1 includes the most corresponding words as the category of the input sentence 1 . As an example, processing unit 11 identifies fashion as the category of input sentence 1 from “boyfriend”, “dinner”, “stylish”, and “clothes” included in input sentence 1 .

また、処理部11は、入力文1に含まれる単語から意図を特定する。例えば、処理部11は、複数の意図それぞれに対応する単語を示す情報を参照する。そして、処理部11は、対応する単語が入力文1に最も多く含まれる意図を入力文1の意図として特定する。一例として、処理部11は、入力文1に含まれる「調べて」から、入力文1のカテゴリを検索と特定する。 Also, the processing unit 11 identifies the intention from the words included in the input sentence 1 . For example, the processing unit 11 refers to information indicating words corresponding to each of a plurality of intentions. Then, the processing unit 11 identifies the intention that the input sentence 1 includes the most corresponding words as the intention of the input sentence 1 . As an example, the processing unit 11 identifies the category of the input sentence 1 as “search” after “investigate” included in the input sentence 1 .

次に、処理部11は、入力文1から伝達要素それぞれに対応する単語を抽出する。伝達要素は、入力文1に対するユーザの要求を満たす応答をするための情報を伝達するために、入力文1に要求される要素である。伝達要素には、例えば、時間を示す「いつ」、場所を示す「どこ」、物を示す「なに」、人を示す「だれ」等が含まれる。また、伝達要素は、カテゴリごとに設定されている。処理部11は、特定したカテゴリに対応する伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素を特定する。 Next, the processing unit 11 extracts words corresponding to the transfer elements from the input sentence 1 . The conveying element is an element required of the input sentence 1 in order to convey information for responding to the input sentence 1 to satisfy the user's request. The communication elements include, for example, "when" indicating time, "where" indicating place, "what" indicating object, "who" indicating person, and the like. Also, the transmission factor is set for each category. The processing unit 11 identifies missing communicative elements for which corresponding words have not been extracted from the communicative elements corresponding to the identified category.

一例として、処理部11は、入力文1のカテゴリであるファッションに対応する伝達要素の、「いつ」、「どこ」、「なに」、「だれ」それぞれに対応する単語を入力文1から抽出する。すると、処理部11は、「どこ」に対応する「ディナー」、「なに」に対応する「洋服」および「だれ」に対応する「彼氏」を抽出する。処理部11は、対応する単語が抽出されなかった「いつ」を、欠落伝達要素と特定する。 As an example, the processing unit 11 extracts from the input sentence 1 words corresponding to "when", "where", "what", and "who" of the communication elements corresponding to fashion, which is the category of the input sentence 1. do. Then, the processing unit 11 extracts "dinner" corresponding to "where", "clothes" corresponding to "what", and "boyfriend" corresponding to "who". The processing unit 11 identifies "when" for which no corresponding word is extracted as a missing transfer element.

処理部11は、欠落伝達要素と意図とに基づいて定型文を選択する。例えば、処理部11は、カテゴリと意図と欠落伝達要素との組み合わせそれぞれに対応する定型文の情報を参照する。そして、処理部11は、入力文1から特定したカテゴリと意図と欠落伝達要素との組み合わせに対応する定型文を選択する。なお、定型文は、空欄を含んでいてもよい。一例として、処理部11は、入力文1のカテゴリであるファッションと、入力文1の意図である検索と、入力文1の欠落伝達要素である「いつ」との組み合わせに対応する定型文「[]は[]の予定ですか。」を選択する。 The processing unit 11 selects a fixed phrase based on the missing conveying element and the intention. For example, the processing unit 11 refers to the information of fixed phrases corresponding to each combination of the category, the intention, and the missing communication element. Then, the processing unit 11 selects from the input sentence 1 a fixed form sentence corresponding to the combination of the specified category, intention, and missing conveying element. Note that the fixed phrase may include blanks. As an example, the processing unit 11 generates a fixed phrase "[ Is ] an appointment for [ ]?"

そして、処理部11は、入力文1に含まれる単語と定型文とに基づいた応答2を出力する。例えば、処理部11は、定型文に含まれる空欄に、入力文1に含まれる単語と、欠落伝達要素を要求するための単語とを入れることで応答2を生成する。一例として、処理部11は、定型文「[]は[]の予定ですか。」に、入力文1に含まれる単語「ディナー」と、欠落伝達要素「いつ」を要求するための単語「いつ頃」を入れることで、「ディナーは、いつ頃の予定ですか。」というテキストを応答2として生成する。そして、処理部11は、生成した応答2を出力する。処理部11は、応答2のテキストを示す音声を出力してもよいし、応答2のテキストを画面表示してもよい。 Then, the processing unit 11 outputs a response 2 based on the words and fixed form sentences included in the input sentence 1 . For example, the processing unit 11 generates the response 2 by inserting the words included in the input sentence 1 and the words for requesting the missing transfer element into the blanks included in the standard sentence. As an example, the processing unit 11 adds the word “dinner” included in the input sentence 1 and the word “when” for requesting the missing conveying element “when” to the standard sentence “Are you planning to have [] at []?” By entering "around", the text "When are you planning to have dinner?" is generated as response 2. Then, the processing unit 11 outputs the generated response 2 . The processing unit 11 may output a voice indicating the text of the response 2, or may display the text of the response 2 on the screen.

第1の実施の形態によれば、情報処理装置10の処理部11は、入力文1から伝達要素それぞれに対応する単語を抽出する。処理部11は、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択する。そして、処理部11は、入力文に含まれる単語と定型文とに基づいた応答2を出力する。 According to the first embodiment, the processing unit 11 of the information processing device 10 extracts words corresponding to each of the communication elements from the input sentence 1 . The processing unit 11 selects a fixed phrase based on the missing communicative elements for which no corresponding words have been extracted from the communicative elements. Then, the processing unit 11 outputs a response 2 based on the words and fixed phrases included in the input sentence.

ここで、情報処理装置10は、伝達要素に対応する単語をすべてユーザから取得できれば、ユーザの要求を満たすように応答できる可能性が高い。情報処理装置10は、応答2による自然なやりとりによって欠落伝達要素に対応する単語をユーザに要求できる。よって、情報処理装置10は、円滑な対話ができるシステムを実現することができる。 Here, if the information processing apparatus 10 can acquire all the words corresponding to the communication elements from the user, there is a high possibility that the information processing apparatus 10 can respond so as to satisfy the user's request. The information processing apparatus 10 can request a word corresponding to the missing communication element from the user through a natural exchange of responses 2 . Therefore, the information processing apparatus 10 can implement a system that enables smooth dialogue.

また、処理部11は、入力文1に含まれる単語からカテゴリを特定し、カテゴリに対応する伝達要素のうちの欠落伝達要素に基づいて定型文を選択する。これにより、情報処理装置10は、正確な欠落伝達要素に対応する単語をユーザに要求できる。 Further, the processing unit 11 identifies a category from the words included in the input sentence 1, and selects a fixed phrase based on the missing communicative element among the communicative elements corresponding to the category. Thereby, the information processing apparatus 10 can request the user for the word corresponding to the correct missing conveying element.

また、処理部11は、入力文1に含まれる単語から意図を特定し、欠落伝達要素と意図とに基づいて定型文を選択する。これにより、情報処理装置10は、ユーザが入力文1を入力した意図に合わせた応答ができる。 In addition, the processing unit 11 identifies the intention from the words included in the input sentence 1, and selects a standard sentence based on the missing communication element and the intention. As a result, the information processing apparatus 10 can respond in accordance with the user's intention of inputting the input sentence 1 .

なお、処理部11は、第1入力文に含まれる単語からカテゴリを特定し、伝達要素のうちの対応する単語が第1入力文から抽出されなかった第1欠落伝達要素に基づいて第1定型文を選択し、第1入力文に含まれる単語と第1定型文とに基づいた第1応答を出力し、第2入力文を取得すると、伝達要素のうちの対応する単語が第1入力文と第2入力文とから抽出されなかった第2欠落伝達要素に基づいて第2定型文を選択し、第1入力文に含まれる単語と第2入力文に含まれる単語と第2定型文とに基づいた第2応答を出力してもよい。これにより、情報処理装置10は、ユーザと複数回のやりとりがある場合も欠落伝達要素をユーザに自然に要求できる。 Note that the processing unit 11 identifies a category from the words included in the first input sentence, and determines the category of the first fixed form based on the first missing conveying element for which the corresponding word of the conveying elements was not extracted from the first input sentence. Selecting a sentence, outputting a first response based on the words contained in the first input sentence and the first fixed form sentence, obtaining the second input sentence, and obtaining the corresponding word of the communication elements in the first input sentence and the second input sentence based on the second missing conveying element not extracted from the second input sentence, the words contained in the first input sentence, the words contained in the second input sentence, and the second fixed sentence may output a second response based on As a result, the information processing apparatus 10 can naturally request the missing transfer element from the user even when there are multiple interactions with the user.

〔第2の実施の形態〕
次に、第2の実施の形態について説明する。第2の実施の形態は、対話システムをユーザに提供するものである。
[Second embodiment]
Next, a second embodiment will be described. The second embodiment provides a dialogue system for users.

図2は、第2の実施の形態に係る情報処理システムの一例を示す図である。第2の実施の形態の情報処理システムは、情報処理装置100およびPC(Personal Computer)200を有する。情報処理装置100およびPC200は、ネットワーク30に接続されている。ネットワーク30は、例えば、インターネット等の広域ネットワークである。 FIG. 2 is a diagram illustrating an example of an information processing system according to the second embodiment. The information processing system of the second embodiment has an information processing device 100 and a PC (Personal Computer) 200 . Information processing apparatus 100 and PC 200 are connected to network 30 . The network 30 is, for example, a wide area network such as the Internet.

情報処理装置100は、対話システムを提供するサーバコンピュータである。情報処理装置100は、ユーザ20によるユーザ発話をPC200から取得する。情報処理装置100は、取得したユーザ発話に対する応答を生成する。 The information processing device 100 is a server computer that provides an interactive system. The information processing apparatus 100 acquires user utterances by the user 20 from the PC 200 . The information processing apparatus 100 generates a response to the acquired user's utterance.

PC200は、ユーザ20が操作するコンピュータである。PC200は、ユーザ20のユーザ発話を取得する。PC200は、取得したユーザ発話を情報処理装置100に送信する。PC200は、ユーザ発話に対する応答を情報処理装置100から取得し、取得した応答を出力する。 PC 200 is a computer operated by user 20 . The PC 200 acquires user utterances of the user 20 . The PC 200 transmits the acquired user speech to the information processing apparatus 100 . The PC 200 acquires a response to the user's utterance from the information processing device 100 and outputs the acquired response.

なお、第2の実施の形態では、情報処理装置100がユーザ20の発話音声を取得するが、PC200がユーザ20の発話音声から音声認識によって発話音声の内容を示すテキストを生成し、生成したテキストを情報処理装置100に送信してもよい。また、第2の実施の形態では、PC200がユーザ20からの音声を取得し、情報処理装置100が応答を生成し、生成した応答をPC200に出力させるが、情報処理装置100が有する機能をPC200が有し、PC200が全体の処理を実行してもよい。 In the second embodiment, the information processing apparatus 100 acquires the uttered voice of the user 20, but the PC 200 generates a text indicating the content of the uttered voice from the uttered voice of the user 20 by voice recognition, and generates the generated text. may be transmitted to the information processing apparatus 100 . In the second embodiment, the PC 200 acquires the voice from the user 20, the information processing apparatus 100 generates a response, and causes the PC 200 to output the generated response. , and the PC 200 may perform the entire process.

図3は、情報処理装置のハードウェアの一構成例を示す図である。情報処理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101は、プログラムの命令を実行するプロセッサである。なお、CPU101は複数のプロセッサコアを含んでもよい。また、CPU101は、複数のプロセッサであってもよく、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)等であってもよい。また、CPU101がプログラムを実行することで実現する機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)等の電子回路で実現してもよい。CPU101には、バス109を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。 FIG. 3 is a diagram illustrating a configuration example of hardware of an information processing apparatus. The information processing apparatus 100 is entirely controlled by a CPU (Central Processing Unit) 101 . The CPU 101 is a processor that executes program instructions. Note that the CPU 101 may include multiple processor cores. Also, the CPU 101 may be a plurality of processors, an MPU (Micro Processing Unit), a DSP (Digital Signal Processor), or the like. Moreover, at least part of the functions realized by the CPU 101 executing a program may be realized by an electronic circuit such as an ASIC (Application Specific Integrated Circuit) or a PLD (Programmable Logic Device). A RAM (Random Access Memory) 102 and a plurality of peripheral devices are connected to the CPU 101 via a bus 109 .

RAM102は、情報処理装置100の主記憶装置である。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に利用する各種データが格納される。なお、情報処理装置100は、RAM以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。 A RAM 102 is a main storage device of the information processing apparatus 100 . The RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the CPU 101 . Further, the RAM 102 stores various data used for processing by the CPU 101 . Note that the information processing apparatus 100 may include a type of memory other than the RAM, or may include a plurality of memories.

バス109に接続されている周辺機器としては、HDD(Hard Disk Drive)103、GPU(Graphics Processing Unit)104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。 Peripheral devices connected to the bus 109 include a HDD (Hard Disk Drive) 103 , a GPU (Graphics Processing Unit) 104 , an input interface 105 , an optical drive device 106 , a device connection interface 107 and a network interface 108 .

HDD103は、情報処理装置100の補助記憶装置である。HDD103は、内蔵した磁気ディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、情報処理装置100は、フラッシュメモリやSSD(Solid State Drive)等の他の種類の補助記憶装置を備えてもよく、複数の補助記憶装置を備えてもよい。 The HDD 103 is an auxiliary storage device of the information processing device 100 . The HDD 103 magnetically writes data to and reads data from a built-in magnetic disk. The HDD 103 stores OS programs, application programs, and various data. The information processing apparatus 100 may include other types of auxiliary storage devices such as flash memory and SSD (Solid State Drive), or may include a plurality of auxiliary storage devices.

GPU104には、モニタ31が接続されている。GPU104は、CPU101からの命令に従って、画像をモニタ31の画面に表示させる。モニタ31としては、有機EL(Electro Luminescence)を用いた表示装置や液晶表示装置等がある。 A monitor 31 is connected to the GPU 104 . The GPU 104 displays an image on the screen of the monitor 31 according to instructions from the CPU 101 . Examples of the monitor 31 include a display device using an organic EL (Electro Luminescence), a liquid crystal display device, and the like.

入力インタフェース105には、キーボード32とマウス33とが接続されている。入力インタフェース105は、キーボード32やマウス33から送られてくる信号をCPU101に送信する。なお、マウス33は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボール等がある。 A keyboard 32 and a mouse 33 are connected to the input interface 105 . The input interface 105 transmits signals sent from the keyboard 32 and the mouse 33 to the CPU 101 . Note that the mouse 33 is an example of a pointing device, and other pointing devices can also be used. Other pointing devices include touch panels, tablets, touch pads, trackballs, and the like.

光学ドライブ装置106は、レーザ光等を利用して、光ディスク34に記録されたデータの読み取りを行う。光ディスク34は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク34には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等がある。 The optical drive device 106 uses laser light or the like to read data recorded on the optical disc 34 . The optical disk 34 is a portable recording medium on which data is recorded so as to be readable by light reflection. The optical disc 34 includes DVD (Digital Versatile Disc), DVD-RAM, CD-ROM (Compact Disc Read Only Memory), CD-R (Recordable)/RW (ReWritable), and the like.

機器接続インタフェース107は、情報処理装置100に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置35やメモリリーダライタ36を接続することができる。メモリ装置35は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ36は、メモリカード37へのデータの書き込み、またはメモリカード37からのデータの読み出しを行う装置である。メモリカード37は、カード型の記録媒体である。 The device connection interface 107 is a communication interface for connecting peripheral devices to the information processing apparatus 100 . For example, the device connection interface 107 can be connected to the memory device 35 and the memory reader/writer 36 . The memory device 35 is a recording medium equipped with a communication function with the device connection interface 107 . The memory reader/writer 36 is a device that writes data to the memory card 37 or reads data from the memory card 37 . The memory card 37 is a card-type recording medium.

ネットワークインタフェース108は、ネットワーク30に接続されている。ネットワークインタフェース108は、ネットワーク30を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。 Network interface 108 is connected to network 30 . Network interface 108 transmits and receives data to and from other computers or communication devices via network 30 .

情報処理装置100は、以上のようなハードウェア構成によって、第2の実施の形態の処理機能を実現することができる。なお、PC200も、図3に示した情報処理装置100と同様のハードウェアにより実現することができる。ただし、PC200は、音声を入出力するためのマイクおよびスピーカをさらに有する。また、第1の実施の形態に示した情報処理装置10も、図3に示した情報処理装置100と同様のハードウェアにより実現することができる。また、CPU101は、第1の実施の形態に示した処理部11の一例である。 The information processing apparatus 100 can implement the processing functions of the second embodiment with the hardware configuration described above. Note that the PC 200 can also be realized by hardware similar to the information processing apparatus 100 shown in FIG. However, PC 200 further has a microphone and a speaker for inputting and outputting audio. The information processing apparatus 10 shown in the first embodiment can also be realized by hardware similar to the information processing apparatus 100 shown in FIG. Also, the CPU 101 is an example of the processing unit 11 described in the first embodiment.

情報処理装置100は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施の形態の処理機能を実現する。情報処理装置100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置100に実行させるプログラムをHDD103に格納しておくことができる。CPU101は、HDD103内のプログラムの少なくとも一部をRAM102にロードし、プログラムを実行する。また、情報処理装置100に実行させるプログラムを、光ディスク34、メモリ装置35、メモリカード37等の可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばCPU101からの制御により、HDD103にインストールされた後、実行可能となる。また、CPU101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。 The information processing apparatus 100 implements the processing functions of the second embodiment by executing a program recorded in a computer-readable recording medium, for example. A program describing the contents of processing to be executed by the information processing apparatus 100 can be recorded in various recording media. For example, a program to be executed by the information processing apparatus 100 can be stored in the HDD 103 . CPU 101 loads at least part of the program in HDD 103 into RAM 102 and executes the program. Also, the program to be executed by the information processing apparatus 100 can be recorded in a portable recording medium such as the optical disk 34, the memory device 35, the memory card 37, or the like. A program stored in a portable recording medium can be executed after being installed in the HDD 103 under the control of the CPU 101, for example. Alternatively, the CPU 101 can read and execute the program directly from the portable recording medium.

図2に示すような情報処理システムで、情報処理装置100は、ユーザ20に対話システムを提供する。情報処理装置100は、ユーザ20の要求を満たす応答をするための情報を伝達するために要求される伝達要素に対応する単語がユーザ発話に含まれていれば、適切な応答ができることが多い。伝達要素には、例えば、時間を示す「いつ」、場所を示す「どこ」、物を示す「なに」、人を示す「だれ」、金額を示す「いくら」等が含まれる。また、伝達要素は、対話内容のカテゴリによって変動することがある。 In the information processing system as shown in FIG. 2, the information processing device 100 provides the user 20 with an interactive system. The information processing apparatus 100 can often make an appropriate response if the user's utterance includes a word corresponding to a transmission element required to transmit information for making a response that satisfies the user's 20 request. The communication elements include, for example, "when" indicating time, "where" indicating place, "what" indicating object, "who" indicating person, and "how much" indicating amount. Also, the communication factor may vary depending on the category of interaction content.

ここで、ユーザ発話に対応する単語が含まれていない伝達要素(欠落伝達要素)がある場合、ユーザ20の要求を満たす応答をするために、欠落伝達要素に対応する単語を推定するための情報を入力する入力操作をユーザ20に促すことが考えられる。しかし、ユーザ20に入力操作を促す場合、円滑な対話ができない。そこで、第2の実施の形態では、情報処理装置100は、欠落伝達要素に対応する定型文を用いた応答を出力することで円滑な対話によって欠落伝達要素をユーザ20に要求する。 Here, when there is a transfer element (missing transfer element) that does not contain a word corresponding to the user's utterance, information for estimating the word corresponding to the missing transfer element in order to make a response that satisfies the request of the user 20 It is conceivable to prompt the user 20 to perform an input operation of inputting . However, when prompting the user 20 to perform an input operation, a smooth dialogue cannot take place. Therefore, in the second embodiment, the information processing apparatus 100 requests the missing communicative element from the user 20 through smooth dialogue by outputting a response using a fixed phrase corresponding to the missing communicative element.

次に、情報処理装置100の機能について詳細に説明する。
図4は、情報処理装置の機能例を示すブロック図である。情報処理装置100は、記憶部110、発話解析部120、単語解析部130および応答生成部140を有する。記憶部110は、RAM102またはHDD103の記憶領域を用いて実現される。発話解析部120、単語解析部130および応答生成部140は、RAM102に記憶されたプログラムをCPU101が実行することで実現される。記憶部110は、カテゴリ情報111、意図情報112、伝達要素情報113、類義語情報114、欠落伝達要素情報115、定型文情報116およびアイテム情報117を有する。
Next, functions of the information processing apparatus 100 will be described in detail.
FIG. 4 is a block diagram showing an example of functions of the information processing apparatus. The information processing device 100 has a storage unit 110 , an utterance analysis unit 120 , a word analysis unit 130 and a response generation unit 140 . Storage unit 110 is implemented using a storage area of RAM 102 or HDD 103 . Utterance analysis unit 120 , word analysis unit 130 and response generation unit 140 are implemented by CPU 101 executing a program stored in RAM 102 . Storage unit 110 has category information 111 , intention information 112 , communicative element information 113 , synonym information 114 , missing communicative element information 115 , fixed phrase information 116 and item information 117 .

カテゴリ情報111は、カテゴリと単語との対応関係を示す。意図情報112は、意図と単語との対応関係を示す。伝達要素情報113は、カテゴリと伝達要素との対応関係およびカテゴリと伝達要素との組み合わせと単語との対応関係を示す。類義語情報114には、伝達要素情報113に登録されている単語の類義語が登録されている。欠落伝達要素情報115は、欠落伝達要素を特定するための情報である。定型文情報116は、カテゴリと意図と欠落伝達要素との組み合わせと、定型文との対応関係を示す。アイテム情報117は、テキスト内に含まれる単語から当該テキストと関連するアイテムを特定するための情報である。 The category information 111 indicates correspondence between categories and words. The intention information 112 indicates correspondence between intentions and words. The communicative element information 113 indicates the correspondence between categories and communicative elements and the correspondence between combinations of categories and communicative elements and words. Synonyms of the words registered in the transfer element information 113 are registered in the synonym information 114 . The missing transfer element information 115 is information for specifying the missing transfer element. The fixed phrase information 116 indicates the correspondence relationship between combinations of categories, intentions, and missing communication elements, and fixed phrases. The item information 117 is information for identifying items related to the text from words included in the text.

発話解析部120は、ユーザ20の発話音声から単語を抽出する。まず、発話解析部120は、ユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。発話解析部120は、取得したユーザ発話に対する音声認識によって、ユーザ発話を示すテキスト(発話テキスト)を生成し、発話テキストに含まれる単語に分割をする。なお、発話テキストは、第1の実施の形態に示した入力文1および第1入力文の一例である。 The utterance analysis unit 120 extracts words from the uttered voice of the user 20 . First, the utterance analysis unit 120 acquires user utterances. For example, the utterance analysis unit 120 acquires the voice representing the user utterance of the user 20 from the PC 200 . The utterance analysis unit 120 generates a text (utterance text) representing the user utterance by performing voice recognition on the acquired user utterance, and divides the text into words included in the utterance text. Note that the spoken text is an example of the input sentence 1 and the first input sentence shown in the first embodiment.

また、発話解析部120は、応答生成部140による応答出力から一定期間内に発せられたユーザ発話(二回目以降のユーザ発話)から、単語を抽出する。例えば、発話解析部120は、二回目以降のユーザ発話を取得すると、音声認識によって二回目以降のユーザ発話を示すテキスト(二回目以降の発話テキスト)を生成し、二回目以降の発話テキストに含まれる単語に分割をする。なお、二回目以降の発話テキストは、第1の実施の形態に示した第2入力文の一例である。 The utterance analysis unit 120 also extracts words from user utterances (second and subsequent user utterances) uttered within a certain period of time from the response output by the response generation unit 140 . For example, when acquiring the second and subsequent user utterances, the utterance analysis unit 120 generates text indicating the second and subsequent user utterances (second and subsequent utterance texts) by voice recognition, and split into words that can be Note that the second and subsequent utterance texts are an example of the second input sentence shown in the first embodiment.

単語解析部130は、発話テキストから伝達要素それぞれに対応する単語を抽出する。まず、単語解析部130は、発話テキストのカテゴリおよび意図を特定する。例えば、単語解析部130は、カテゴリ情報111から、発話テキストに含まれる単語に対応するカテゴリを、発話テキストのカテゴリとして特定する。また、例えば、単語解析部130は、意図情報112から、発話テキストに含まれる単語に対応する意図を、発話テキストの意図として特定する。次に、単語解析部130は、欠落伝達要素情報115から発話テキストのカテゴリに対応する伝達要素を特定する。単語解析部130は、伝達要素情報113から、発話テキストのカテゴリと、発話テキストの伝達要素それぞれとに対応する単語を特定する。そして、単語解析部130は、特定した単語を発話テキストから抽出する。なお、単語解析部130は、以前の会話情報および閲覧情報から伝達要素に対応する単語を補完してもよい。 The word analysis unit 130 extracts words corresponding to each transfer element from the spoken text. First, word analysis unit 130 identifies the category and intent of the spoken text. For example, from the category information 111, the word analysis unit 130 identifies a category corresponding to a word included in the spoken text as the category of the spoken text. Also, for example, the word analysis unit 130 identifies, from the intention information 112, the intention corresponding to the word included in the spoken text as the intention of the spoken text. Next, the word analysis unit 130 identifies a communicative element corresponding to the category of the utterance text from the missing communicative element information 115 . The word analysis unit 130 identifies, from the transfer element information 113, words corresponding to the categories of the speech text and the transfer elements of the speech text. Then, the word analysis unit 130 extracts the identified words from the spoken text. Note that the word analysis unit 130 may complement words corresponding to the communication elements from previous conversation information and browsing information.

単語解析部130は、ある伝達要素に対応する単語がいずれも発話テキストから抽出されなかった場合、当該伝達要素を発話テキストの欠落伝達要素として特定する。発話テキストの欠落伝達要素は、第1の実施の形態に示した第1欠落伝達要素の一例である。単語解析部130は、発話テキストの欠落伝達要素が特定された場合、欠落伝達要素情報115から、発話テキストの欠落伝達要素を要求するための単語(発話テキストの欠落伝達要素に対応する欠落単語)を特定する。 When no word corresponding to a certain communicative element is extracted from the spoken text, the word analysis unit 130 identifies the communicative element as a missing communicative element of the uttered text. The missing conveying element of the spoken text is an example of the first missing conveying element shown in the first embodiment. When the missing communicative element of the utterance text is identified, the word analysis unit 130 extracts a word for requesting the missing communicative element of the uttered text (missing word corresponding to the missing communicative element of the uttered text) from the missing communicative element information 115. identify.

また、単語解析部130は、二回目以降の発話テキストから、発話テキストのカテゴリに対応する伝達要素それぞれに対応する単語を抽出する。そして、単語解析部130は、ある伝達要素に対応する単語がいずれも発話テキストおよび二回目以降の発話テキストから抽出されなかった場合、当該伝達要素を二回目以降の発話テキストの欠落伝達要素として特定する。二回目以降の発話テキストの欠落伝達要素は、第1の実施の形態に示した第2欠落伝達要素の一例である。単語解析部130は、二回目以降の発話テキストの欠落伝達要素が特定された場合、欠落伝達要素情報115から、二回目以降の発話テキストの欠落伝達要素に対応する欠落単語を特定する。 In addition, the word analysis unit 130 extracts words corresponding to the transfer elements corresponding to the category of the utterance text from the second and subsequent utterance texts. Then, when no word corresponding to a certain communicative element is extracted from the utterance text and the second and subsequent utterance texts, the word analysis unit 130 identifies the communicative element as a missing communicative element of the second and subsequent utterance texts. do. The missing conveying element of the second and subsequent utterance texts is an example of the second missing conveying element shown in the first embodiment. When the missing communicative elements of the second and subsequent utterance texts are identified, the word analysis unit 130 identifies, from the missing communicative element information 115, the missing words corresponding to the missing communicative elements of the second and subsequent utterance texts.

応答生成部140は、発話テキストに対する応答を生成し、出力する。例えば、応答生成部140は、定型文情報116から、発話テキストのカテゴリと発話テキストの意図と発話テキストの欠落伝達要素に対応する定型文を選択する。なお、発話テキストに基づいて選択された定型文は、第1の実施の形態に示した第1定型文の一例である。 The response generator 140 generates and outputs a response to the spoken text. For example, the response generator 140 selects from the fixed phrase information 116 a fixed phrase corresponding to the category of the spoken text, the intention of the spoken text, and the missing conveying element of the spoken text. The standardized sentence selected based on the spoken text is an example of the first standardized sentence shown in the first embodiment.

そして、応答生成部140は、欠落単語および発話テキストに含まれる単語を、選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。なお、発話テキストに基づいて出力される応答は、第1の実施の形態に示した第1応答の一例である。 Then, the response generation unit 140 inserts the missing words and the words included in the utterance text into the blanks of the selected fixed phrase to generate the response text. The response generation unit 140 transmits the generated response text to the PC 200 and causes the PC 200 to output a voice indicating the response text. Note that the response output based on the spoken text is an example of the first response shown in the first embodiment.

また、応答生成部140は、二回目以降の発話テキストに対する応答を生成し、出力する。例えば、応答生成部140は、定型文情報116から、発話テキストのカテゴリと発話テキストの意図と二回目以降の発話テキストの欠落伝達要素に対応する定型文を選択する。なお、二回目以降の発話テキストに基づいて選択された定型文は、第1の実施の形態に示した第2定型文の一例である。 Also, the response generation unit 140 generates and outputs responses to the second and subsequent utterance texts. For example, the response generation unit 140 selects, from the fixed phrase information 116, fixed phrases corresponding to the category of the spoken text, the intention of the spoken text, and the missing conveying elements of the second and subsequent spoken texts. The standardized sentence selected based on the second and subsequent utterance texts is an example of the second standardized sentence shown in the first embodiment.

そして、応答生成部140は、欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語を、選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。なお、二回目以降の発話テキストに基づいて出力される応答は、第1の実施の形態に示した第2応答の一例である。 Then, the response generation unit 140 puts the missing words, the words included in the spoken text, and the words included in the second and subsequent spoken texts into the blanks of the selected fixed phrase to generate a response text. The response generation unit 140 transmits the generated response text to the PC 200 and causes the PC 200 to output a voice indicating the response text. The responses output based on the second and subsequent utterance texts are an example of the second responses shown in the first embodiment.

また、応答生成部140は、発話テキストの欠落伝達要素または二回目以降の発話テキストの欠落伝達要素が特定されなかった場合、定型文情報116から、欠落伝達要素なしに対応する定型文を選択する。応答生成部140は、発話テキストまたは二回目以降の発話テキストに含まれる単語を選択した定型文の空欄に入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。 In addition, when the missing conveying element of the utterance text or the missing conveying element of the second and subsequent utterance texts is not specified, the response generation unit 140 selects a fixed form sentence corresponding to no missing conveying element from the fixed form sentence information 116. . The response generation unit 140 inserts the words included in the spoken text or the second and subsequent spoken texts into the blanks of the selected fixed phrase to generate a response text. The response generation unit 140 transmits the generated response text to the PC 200 and causes the PC 200 to output a voice indicating the response text.

なお、図4に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。次に、記憶部110に記憶される情報について詳細に説明する。 The lines connecting the elements shown in FIG. 4 indicate part of the communication paths, and communication paths other than the illustrated communication paths can be set. Next, information stored in storage unit 110 will be described in detail.

図5は、カテゴリ情報の一例を示す図である。カテゴリ情報111は、カテゴリと単語との対応関係を示す。カテゴリ情報111は、No.、カテゴリA、カテゴリBおよび単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリAの項目およびカテゴリBの項目それぞれには、カテゴリ名が設定される。なお、カテゴリBの項目にカテゴリ名が設定されたカテゴリが、カテゴリAの項目にカテゴリ名が設定されたカテゴリを細分化したものであってもよい。単語の項目には、カテゴリに対応する単語が設定される。 FIG. 5 is a diagram showing an example of category information. The category information 111 indicates correspondence between categories and words. The category information 111 includes No. , category A, category B and word. No. , the identification number of the record is set. A category name is set for each of the category A item and the category B item. Note that the category whose category name is set in the item of category B may be a subdivision of the category whose category name is set in the item of category A. FIG. A word corresponding to the category is set in the word item.

一例として、カテゴリ情報111には、No.の項目に「0001」、カテゴリAの項目に「ファッション」、カテゴリBの項目に「洋服レディース」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「トップス」、「コート」、「ジャケット」、「スカート」および「ワンピース」が設定されている。識別番号「0001」のレコードは、「トップス」、「コート」、「ジャケット」、「スカート」および「ワンピース」のいずれかの単語が含まれるテキストが「ファッション」および「洋服レディース」のカテゴリに分類されることを示す。 As an example, the category information 111 includes No. A record with identification number "0001" is registered in which "0001" is set in the item of category A, "fashion" is set in the item of category A, and "women's clothes" is set in the item of category B. The word items of the record with the identification number "0001" are set with "tops", "coat", "jacket", "skirt" and "dress". In the record with the identification number "0001", text containing any of the words "tops", "coat", "jacket", "skirt" and "dress" is classified into the categories of "fashion" and "women's clothes". indicates that

図6は、意図情報の一例を示す図である。意図情報112は、意図と単語との対応関係を示す。意図情報112は、No.、意図、処理および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。意図の項目には、意図の名称が設定される。処理の項目には、意図に対する処理名が設定される。単語の項目には、意図に対応する単語が設定される。 FIG. 6 is a diagram showing an example of intention information. The intention information 112 indicates correspondence between intentions and words. The intention information 112 is No. , Intentions, Actions and Words. No. , the identification number of the record is set. The name of intention is set in the item of intention. A processing name for an intention is set in the processing item. A word corresponding to the intention is set in the word item.

一例として、意図情報112には、No.の項目に「0001」、意図の項目に「検索」、処理の項目に「確認」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「調べて」、「検索して」および「おしえて」が設定されている。識別番号「0001」のレコードは、「調べて」、「検索して」および「おしえて」のいずれかの単語が含まれるテキストの意図が「検索」であることを示す。また、識別番号「0001」のレコードは、「検索」を意図とするテキストに対する処理として「確認」が適切であることを示す。 As an example, the intention information 112 includes No. A record with an identification number of "0001" is registered in which "0001" is set in the item of , "search" is set in the item of intention, and "confirmation" is set in the item of process. In the word field of the record with the identification number "0001", "search", "search" and "tell me" are set. The record with the identification number "0001" indicates that the intent of the text containing any of the words "examine", "search" and "tell me" is "search". Also, the record with the identification number “0001” indicates that “confirmation” is appropriate as the processing for the text intended for “search”.

図7は、伝達要素情報の一例を示す図である。伝達要素情報113は、カテゴリと伝達要素との対応関係およびカテゴリと伝達要素との組み合わせと単語との対応関係を示す。伝達要素情報113は、No.、カテゴリ、伝達要素および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。単語の項目には、カテゴリと伝達要素との組み合わせに対応する単語が設定される。 FIG. 7 is a diagram showing an example of transfer element information. The communicative element information 113 indicates the correspondence between categories and communicative elements and the correspondence between combinations of categories and communicative elements and words. The transmission element information 113 includes No. , Categories, Communicating Elements and Words. No. , the identification number of the record is set. A category name is set in the category item. A transfer element name is set in the transfer element item. Words corresponding to combinations of categories and communication elements are set in the word item.

一例として、伝達要素情報113には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「月」、「上旬」、「中旬」、「下旬」、「誕生日」、「記念日」、「春」、「夏」、「秋」および「冬」が設定されている。識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素「いつ」に対応する単語が、「月」、「上旬」、「中旬」、「下旬」、「誕生日」、「記念日」、「春」、「夏」、「秋」および「冬」であることを示す。 As an example, the transmission element information 113 includes No. A record with an identification number of "0001" is registered in which "0001" is set in the item of , "fashion" is set in the item of category, and "when" is set in the item of communication element. The word items of the record with the identification number “0001” include “month”, “early”, “mid”, “late”, “birthday”, “anniversary”, “spring”, “summer”, “autumn”. ” and “Winter” are set. In the record with the identification number “0001”, the word corresponding to the communication element “when” of the text in the “fashion” category is “month”, “early”, “mid”, “late”, “birthday”, Indicates "Anniversary", "Spring", "Summer", "Autumn" and "Winter".

図8は、類義語情報の一例を示す図である。類義語情報114には、伝達要素情報113に登録されている単語の類義語が登録されている。類義語情報114に、類義語として登録されている単語は、伝達要素情報113に登録されている単語としてあつかわれてもよい。類義語情報114は、No.、カテゴリ、伝達要素および単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。単語の項目には、類義語の関係にある単語が設定される。 FIG. 8 is a diagram showing an example of synonym information. Synonyms of the words registered in the transfer element information 113 are registered in the synonym information 114 . A word registered as a synonym in the synonym information 114 may be treated as a word registered in the transfer element information 113 . The synonym information 114 includes No. , Categories, Communicating Elements and Words. No. , the identification number of the record is set. A category name is set in the category item. A transfer element name is set in the transfer element item. Words having a synonym relationship are set in the word item.

一例として、類義語情報114には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「誕生日」および「記念日」が設定されている。識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素「いつ」に対応する単語である、「誕生日」および「記念日」が類義語の関係であることを示す。 As an example, the synonym information 114 includes No. A record with an identification number of "0001" is registered in which "0001" is set in the item of , "fashion" is set in the item of category, and "when" is set in the item of communication element. "Birthday" and "Anniversary" are set in the word field of the record with the identification number "0001". The record with the identification number “0001” indicates that “birthday” and “anniversary”, which are words corresponding to the communication element “when” of the text in the “fashion” category, are synonymous.

図9は、欠落伝達要素情報の一例を示す図である。欠落伝達要素情報115は、欠落伝達要素を特定するための情報である。なお、図9において[]で囲まれた単語は、[]内の単語で示される種類に分類されるいずれかの単語を示す。欠落伝達要素情報115は、No.、カテゴリ、伝達要素、抽出単語、欠落伝達要素および欠落単語の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、カテゴリに対応するすべての伝達要素名が設定される。抽出単語の項目には、テキストから抽出された単語が設定される。欠落伝達要素の項目には、テキストから対応する単語が抽出されなかった欠落伝達要素名が設定される。欠落単語の項目には、欠落伝達要素に対応する欠落単語が設定される。 FIG. 9 is a diagram showing an example of missing transfer element information. The missing transfer element information 115 is information for specifying the missing transfer element. In addition, in FIG. 9, the words enclosed in [ ] indicate any of the words classified into the types indicated by the words in [ ]. The missing transfer element information 115 includes No. , Category, Communicating Elements, Extracted Words, Missing Communicating Elements and Missing Words. No. , the identification number of the record is set. A category name is set in the category item. All transfer element names corresponding to the category are set in the transfer element item. The word extracted from the text is set in the extracted word item. The Missing Communicative Element field contains the name of a missing communicative element whose corresponding word has not been extracted from the text. Missing words corresponding to missing transfer elements are set in the item of missing words.

一例として、欠落伝達要素情報115には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「いつ」、「どこ」、「だれ」および「なに」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの抽出単語の項目には、「彼氏」、「ディナー」および「洋服」が設定されている。また、識別番号「0001」のレコードの欠落伝達要素の項目には「いつ」、欠落単語の項目には「いつ頃」が設定されている。 As an example, the missing transfer element information 115 includes No. A record with identification number "0001" is registered in which "0001" is set in the item of, "fashion" is set in the item of category, and "when", "where", "who" and "what" are set in the item of communication element. ing. "boyfriend", "dinner" and "clothes" are set in the extracted word field of the record with the identification number "0001". In the record with the identification number "0001", "when" is set in the item of the missing communication element, and "when" is set in the item of the missing word.

識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストの伝達要素が、「いつ」、「どこ」、「だれ」および「なに」であることを示す。また、識別番号「0001」のレコードは、「ファッション」のカテゴリであるテキストから「彼氏」、「ディナー」および「洋服」が抽出された場合、当該テキストの欠落伝達要素が「いつ」であることを示す。また、識別番号「0001」のレコードは、欠落伝達要素「いつ」に対応する欠落単語が「いつ頃」であることを示す。 The record with the identification number “0001” indicates that the communication elements of the text in the “fashion” category are “when”, “where”, “who” and “what”. Also, the record with the identification number "0001" indicates that when "boyfriend", "dinner" and "clothes" are extracted from the text of the category "fashion", the missing communication element of the text is "when". indicates Also, the record with the identification number "0001" indicates that the missing word corresponding to the missing communication element "when" is "when".

図10は、定型文情報の一例を示す図である。定型文情報116は、カテゴリと意図と欠落伝達要素との組み合わせと、定型文との対応関係を示す。なお、図10において[]は、定型文の空欄を示す。定型文情報116は、No.、カテゴリ、意図、処理、欠落伝達要素および定型文の項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。意図の項目には、意図の名称が設定される。処理の項目には、意図に対する処理名が設定される。欠落伝達要素の項目には、欠落伝達要素名が設定される。なお、欠落伝達要素の項目には、欠落伝達要素がないことをしめす「-」が設定されることがある。定型文の項目には、定型文が設定される。 FIG. 10 is a diagram showing an example of fixed phrase information. The fixed phrase information 116 indicates the correspondence relationship between combinations of categories, intentions, and missing communication elements, and fixed phrases. In addition, in FIG. 10, [ ] indicates a blank for fixed phrases. The fixed phrase information 116 includes No. , Categories, Intentions, Actions, Missing Communicative Elements and Boilerplate. No. , the identification number of the record is set. A category name is set in the category item. The name of intention is set in the item of intention. A processing name for an intention is set in the processing item. The missing propagating element name is set in the missing propagating element item. In addition, "-" indicating that there is no missing transfer element may be set in the missing transfer element item. A fixed phrase is set in the fixed phrase item.

一例として、定型文情報116には、No.の項目に「0001」、カテゴリの項目に「ファッション」、意図の項目に「検索」、処理の項目に「確認」、欠落伝達要素の項目に「いつ」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの定型文の項目には、「[]は[]の予定ですか。」が設定されている。識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」、欠落伝達要素が「いつ」であるテキストに対する処理として「確認」が適切であることを示す。また、識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」、欠落伝達要素が「いつ」であるテキストに対する応答を作成するための定型文が「[]は[]の予定ですか。」であることを示す。 As an example, the fixed phrase information 116 includes No. ``0001'' in the item of , ``fashion'' in the item of category, ``search'' in the item of intention, ``confirm'' in the item of processing, and ``when'' in the item of missing communication element. A record is registered. "Is [ ] scheduled for [ ]?" The record with the identification number “0001” indicates that “confirmation” is appropriate as the process for the text whose category is “fashion”, whose intention is “search”, and whose missing communication element is “when”. In addition, the record with the identification number "0001" has a fixed phrase "[] is [] Are you planning?"

図11は、アイテム情報の一例を示す図である。アイテム情報117は、テキスト内に含まれる単語から当該テキストと関連するアイテムを特定するための情報である。アイテム情報117は、No.、カテゴリ、伝達要素、意図、単語およびアイテムの項目を有する。No.の項目には、レコードの識別番号が設定される。カテゴリの項目には、カテゴリ名が設定される。伝達要素の項目には、伝達要素名が設定される。意図の項目には、意図の名称が設定される。単語の項目には、単語が設定される。アイテムの項目には、単語に関連するアイテムが設定される。 FIG. 11 is a diagram showing an example of item information. The item information 117 is information for identifying items related to the text from words included in the text. The item information 117 includes No. , Category, Communicative Element, Intent, Word and Item. No. , the identification number of the record is set. A category name is set in the category item. A transfer element name is set in the transfer element item. The name of intention is set in the item of intention. A word is set in the word item. An item related to the word is set in the item item.

一例として、アイテム情報117には、No.の項目に「0001」、カテゴリの項目に「ファッション」、伝達要素の項目に「なに」、意図の項目に「検索」が設定された識別番号「0001」のレコードが登録されている。識別番号「0001」のレコードの単語の項目には、「10月」、「11月」、「洋服」、「コート」、「ディナー」、「誕生日」および「懇談会」が設定されている。また、識別番号「0001」のレコードのアイテムの項目には、「トレンチコート」が設定されている。 As an example, the item information 117 includes No. A record with an identification number of "0001" is registered in which "0001" is set in the item of the category, "fashion" is set in the item of the category, "what" is set in the item of the communication element, and "search" is set in the item of the intention. "October", "November", "clothes", "coat", "dinner", "birthday" and "social gathering" are set in the word items of the record with the identification number "0001". . In addition, "trench coat" is set in the item item of the record with the identification number "0001".

識別番号「0001」のレコードは、カテゴリが「ファッション」、意図が「検索」のテキストに、「10月」、「11月」、「洋服」、「コート」、「ディナー」、「誕生日」および「懇談会」のいずれかが含まれる場合、当該テキストと「トレンチコート」が関連することを示す。また、識別番号「0001」のレコードは、「トレンチコート」が伝達要素が「なに」に対応することを示す。 The record with the identification number "0001" has the text "fashion" as the category and "search" as the intent, and "October", "November", "clothes", "coat", "dinner", and "birthday". and "round-table", it indicates that the text and "trench coat" are related. Also, the record with the identification number "0001" indicates that "trench coat" corresponds to the transmission element "what".

以下、情報処理装置100が実行する処理の手順について、詳細に説明する。
図12は、応答処理の手順の一例を示すフローチャート(その1)である。以下、図12に示す処理をステップ番号に沿って説明する。
The procedure of the processing executed by the information processing apparatus 100 will be described in detail below.
FIG. 12 is a flowchart (part 1) illustrating an example of a procedure of response processing. The processing shown in FIG. 12 will be described below along with the step numbers.

[ステップS11]発話解析部120は、ユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。
[ステップS12]発話解析部120は、音声認識によってユーザ発話を示すテキスト(発話テキスト)を生成し、発話テキストに含まれる単語に分割をする。例えば、発話解析部120は、ステップS11で取得したユーザ20のユーザ発話を示す音声を音声認識によって発話テキストに変換する。そして、発話解析部120は、発話テキストを形態素解析によって単語に分割する。
[Step S11] The speech analysis unit 120 acquires user speech. For example, the utterance analysis unit 120 acquires the voice representing the user utterance of the user 20 from the PC 200 .
[Step S12] The utterance analysis unit 120 generates a text (utterance text) representing a user utterance by voice recognition, and divides the text into words included in the utterance text. For example, the utterance analysis unit 120 converts the voice indicating the user utterance of the user 20 acquired in step S11 into an uttered text by voice recognition. Then, the speech analysis unit 120 divides the speech text into words by morphological analysis.

[ステップS13]単語解析部130は、発話テキストのカテゴリおよび意図を特定する。例えば、単語解析部130は、カテゴリ情報111から、発話テキストに含まれる単語が単語の項目に設定されたレコードを特定する。そして、単語解析部130は、特定したレコードのカテゴリAおよびカテゴリBの項目に設定されたカテゴリを、発話テキストのカテゴリとして特定する。また、例えば、単語解析部130は、意図情報112から、発話テキストに含まれる単語が単語の項目に設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの意図の項目に設定された意図を、発話テキストの意図として特定する。なお、発話テキストに含まれる単語が単語の項目に設定されたレコードがカテゴリ情報111、意図情報112に複数登録されている場合、単語解析部130は、発話テキストに含まれる単語が、最も多く単語の項目に設定されたレコードを特定する。 [Step S13] The word analysis unit 130 identifies the category and intention of the spoken text. For example, the word analysis unit 130 identifies, from the category information 111, a record in which a word included in the spoken text is set in the word item. Then, the word analysis unit 130 identifies the categories set in the category A and category B items of the identified record as categories of the utterance text. Further, for example, the word analysis unit 130 identifies, from the intention information 112, a record in which a word included in the uttered text is set in the word item. Then, the word analysis unit 130 identifies the intention set in the intention item of the identified record as the intention of the utterance text. Note that when a plurality of records in which a word contained in the spoken text is set in the word item are registered in the category information 111 and the intention information 112, the word analysis unit 130 determines which word is the most common word contained in the spoken text. Identifies the record set in the item of .

[ステップS14]単語解析部130は、発話テキストのカテゴリを特定できたか否かを判定する。単語解析部130は、発話テキストのカテゴリを特定できたと判定した場合、処理をステップS15に進める。また、単語解析部130は、発話テキストのカテゴリを特定できなかったと判定した場合、処理を終了する。 [Step S14] The word analysis unit 130 determines whether or not the category of the spoken text has been identified. When the word analysis unit 130 determines that the category of the uttered text has been specified, the process proceeds to step S15. If the word analysis unit 130 determines that the category of the uttered text could not be identified, the processing ends.

[ステップS15]単語解析部130は、発話テキストの意図を特定できたか否かを判定する。単語解析部130は、発話テキストの意図を特定できたと判定した場合、処理をステップS16に進める。また、単語解析部130は、発話テキストの意図を特定できなかったと判定した場合、処理を終了する。 [Step S15] The word analysis unit 130 determines whether or not the intention of the spoken text has been identified. When the word analysis unit 130 determines that the intention of the spoken text has been identified, the process proceeds to step S16. If the word analysis unit 130 determines that the intention of the uttered text could not be specified, the processing ends.

[ステップS16]単語解析部130は、欠落伝達要素があるか否かを判定する。例えば、単語解析部130は、欠落伝達要素情報115に登録されている、ステップS13で特定した発話テキストのカテゴリがカテゴリの項目に設定されたレコードの、伝達要素の項目に設定された伝達要素を特定する。単語解析部130は、伝達要素情報113から、カテゴリの項目に発話テキストのカテゴリが設定され、伝達要素の項目に欠落伝達要素情報115から特定された伝達要素のいずれかが設定されたレコードを抽出する。そして、単語解析部130は、抽出されたレコードのうち、単語の項目に発話テキストに含まれる単語が設定されていないレコードの伝達要素の項目に設定された伝達要素を発話テキストの欠落伝達要素として特定する。単語解析部130は、発話テキストの欠落伝達要素が特定された場合、欠落伝達要素があると判定し、発話テキストの欠落伝達要素が特定されなかった場合、欠落伝達要素がないと判定する。 [Step S16] The word analysis unit 130 determines whether or not there is a missing transferable element. For example, the word analysis unit 130 extracts the conveying element set in the conveying element item of the record registered in the missing conveying element information 115 in which the category of the uttered text identified in step S13 is set in the category item. Identify. From the communicative element information 113, the word analysis unit 130 extracts records in which the category item is set to the utterance text category and the communicative element item is set to any of the communicative elements specified from the missing communicative element information 115. do. Then, among the extracted records, the word analysis unit 130 regards the transferable element set in the transferable element item of the record in which the word included in the spoken text is not set in the word item as the missing transferable element of the spoken text. Identify. The word analysis unit 130 determines that there is a missing communicative element when the missing communicative element of the uttered text is specified, and determines that there is no missing communicative element when the missing communicative element of the uttered text is not specified.

単語解析部130は、欠落伝達要素があると判定した場合、処理をステップS17に進める。また、単語解析部130は、欠落伝達要素がないと判定した場合、処理をステップS32に進める。 When word analysis unit 130 determines that there is a missing conveying element, the process proceeds to step S17. On the other hand, when word analysis section 130 determines that there is no missing transfer element, the process proceeds to step S32.

[ステップS17]単語解析部130は、欠落伝達要素に対応する欠落単語を特定する。例えば、単語解析部130は、欠落伝達要素情報115から、カテゴリの項目に発話テキストのカテゴリが設定され、欠落伝達要素の項目に発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの欠落単語の項目に設定された単語を欠落伝達要素に対応する欠落単語として特定する。 [Step S17] The word analysis unit 130 identifies missing words corresponding to missing transfer elements. For example, from the missing communicative element information 115, the word analysis unit 130 identifies a record in which the Category item is set to the category of the utterance text and the Missing communicative element item is set to the missing communicative element of the uttered text. Then, the word analysis unit 130 identifies the word set in the missing word item of the identified record as the missing word corresponding to the missing communicative element.

[ステップS18]単語解析部130は、以前の会話情報および閲覧情報を取得する。例えば、単語解析部130は、応答処理の履歴からユーザ20との以前の会話情報を取得する。また、例えば、単語解析部130は、HTTP(Hyper Text Transfer Protocol)のメタ情報からユーザ20がインターネットにより閲覧したとPC200が判定したテキストやWeb表示されるタイトルを、PC200から取得する。 [Step S18] The word analysis unit 130 acquires previous conversation information and browsing information. For example, the word analysis unit 130 acquires previous conversation information with the user 20 from the history of response processing. Further, for example, the word analysis unit 130 acquires from the PC 200 the text that the PC 200 determines that the user 20 browsed through the Internet from the meta information of HTTP (Hyper Text Transfer Protocol) and the title displayed on the Web.

[ステップS19]単語解析部130は、以前の会話情報および閲覧情報を単語に分割する。例えば、単語解析部130は、ステップS18で取得したテキストを形態素解析によって単語に分割する。 [Step S19] The word analysis unit 130 divides the previous conversation information and browsing information into words. For example, the word analysis unit 130 divides the text acquired in step S18 into words by morphological analysis.

[ステップS20]単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があるか否かを判定する。例えば、単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、伝達要素情報113の単語の項目に発話テキストに含まれる単語が設定されていないレコード(欠落伝達要素に対応するレコード)の単語の項目に設定されているか否かを判定する。単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、欠落伝達要素に対応するレコードの単語の項目に設定されている場合、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があると判定する。また、単語解析部130は、以前の会話情報および閲覧情報に含まれる単語が、欠落伝達要素に対応するレコードの単語の項目に設定されていない場合、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語がないと判定する。 [Step S20] The word analysis unit 130 determines whether or not there is a word corresponding to the missing communication element in the previous conversation information and browsing information. For example, the word analysis unit 130 identifies a record in which a word included in the previous conversation information and browsing information is not set in the word item of the communicative element information 113 (a record corresponding to the missing communicative element). ) is set in the word item. If the word included in the previous conversation information and the browsing information is set in the word item of the record corresponding to the missing communication element, the word analysis unit 130 matches the previous conversation information and the browsing information to the missing communication element. It is determined that there is a word that In addition, when the word included in the previous conversation information and the browsing information is not set in the word item of the record corresponding to the missing communication element, the word analysis unit 130 adds the missing communication element to the previous conversation information and the browsing information. It is determined that there is no word corresponding to .

単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語があると判定した場合、処理をステップS21に進める。また、単語解析部130は、以前の会話情報および閲覧情報に欠落伝達要素に対応する単語がないと判定した場合、処理をステップS22に進める。 When word analysis unit 130 determines that there is a word corresponding to the missing transfer element in the previous conversation information and browsing information, the process proceeds to step S21. Moreover, when the word analysis unit 130 determines that there is no word corresponding to the missing transfer element in the previous conversation information and browsing information, the process proceeds to step S22.

[ステップS21]単語解析部130は、以前の会話情報および閲覧情報に含まれる単語によって、欠落伝達要素に対応する単語を補完する。例えば、単語解析部130は、応答生成部140に、以前の会話情報および閲覧情報に含まれる単語のうち、ステップS20で特定した欠落伝達要素に対応する単語を、発話テキストに含まれる単語と同様にあつかわせる。そして、処理がステップS32に進む。 [Step S21] The word analysis unit 130 complements the words corresponding to the missing communication element with the words included in the previous conversation information and browsing information. For example, the word analysis unit 130 causes the response generation unit 140 to convert words corresponding to the missing transfer element identified in step S20 from among the words included in the previous conversation information and the browsing information to the same words included in the spoken text. Let me handle it. Then, the process proceeds to step S32.

図13は、応答処理の手順の一例を示すフローチャート(その2)である。以下、図13に示す処理をステップ番号に沿って説明する。
[ステップS22]応答生成部140は、発話テキストの欠落伝達要素に対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。
FIG. 13 is a flowchart (part 2) showing an example of the procedure of response processing. The processing shown in FIG. 13 will be described below along with the step numbers.
[Step S22] The response generation unit 140 selects a standard sentence corresponding to the missing transfer element of the utterance text. For example, from the standard sentence information 116, the response generation unit 140 sets the category of the utterance text to the category item, sets the intention of the utterance text to the intention item, and sets the missing communicative element of the uttered text to the missing communicative element item. Identifies records with Then, the response generating unit 140 selects the fixed phrase set in the fixed phrase field of the identified record.

[ステップS23]応答生成部140は、定型文、欠落単語および発話テキストに含まれる単語(抽出単語)から応答を生成し、出力する。例えば、応答生成部140は、ステップS22で選択された定型文の空欄に、ステップS17で特定された欠落単語および発話テキストに含まれる単語を入れて応答テキストを生成する。なお、定型文の空欄それぞれには伝達要素が設定されていてもよく、応答生成部140は、ステップS17で特定された欠落単語および発話テキストに含まれる単語のうち、空欄に設定された伝達要素に対応する単語を各空欄に入れてもよい。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。 [Step S23] The response generator 140 generates and outputs a response from the standard sentence, missing words, and words (extracted words) included in the spoken text. For example, the response generation unit 140 inserts the missing words identified in step S17 and the words included in the utterance text into the blanks of the standard sentence selected in step S22 to generate the response text. Note that a communication element may be set in each of the blanks of the standard sentence, and the response generation unit 140 selects the communication element set in the blank among the missing words identified in step S17 and the words included in the utterance text. You may fill each blank with the word corresponding to . The response generation unit 140 transmits the generated response text to the PC 200 and causes the PC 200 to output a voice indicating the response text.

[ステップS24]発話解析部120は、一定期間内に次のユーザ発話を取得したか否かを判定する。発話解析部120は、一定期間内に次のユーザ発話を取得したと判定した場合、処理をステップS26に進める。また、発話解析部120は、一定期間内に次のユーザ発話を取得しなかったと判定した場合、処理をステップS25に進める。 [Step S24] The utterance analysis unit 120 determines whether or not the next user utterance has been obtained within a certain period of time. If the utterance analysis unit 120 determines that the next user utterance has been obtained within the certain period of time, the process proceeds to step S26. On the other hand, if the utterance analysis unit 120 determines that the next user utterance has not been obtained within the certain period of time, the process proceeds to step S25.

[ステップS25]応答生成部140は、再発話処理をする。例えば、応答生成部140は、ユーザ20に発話を促すテキスト(例えば、「よく聞き取れなかった・・・。」)をPC200に送信し、送信したテキストを示す音声をPC200に出力させる。そして、処理が終了する。 [Step S25] The response generator 140 performs re-speech processing. For example, the response generator 140 transmits a text prompting the user 20 to speak (for example, "I couldn't hear you very well...") to the PC 200, and causes the PC 200 to output a voice indicating the transmitted text. Then the process ends.

[ステップS26]発話解析部120は、二回目以降のユーザ発話を取得する。例えば、発話解析部120は、PC200からユーザ20のユーザ発話を示す音声を取得する。
[ステップS27]発話解析部120は、音声認識によって二回目以降のユーザ発話を示すテキスト(二回目以降の発話テキスト)を生成し、二回目以降の発話テキストに含まれる単語に分割をする。例えば、発話解析部120は、ステップS26で取得したユーザ20のユーザ発話を示す音声を音声認識によって二回目以降の発話テキストに変換する。そして、発話解析部120は、二回目以降の発話テキストを形態素解析によって単語に分割する。
[Step S26] The utterance analysis unit 120 acquires second and subsequent user utterances. For example, the utterance analysis unit 120 acquires the voice representing the user utterance of the user 20 from the PC 200 .
[Step S27] The utterance analysis unit 120 generates a text representing the second and subsequent user utterances (second and subsequent utterance texts) through voice recognition, and divides the text into words included in the second and subsequent utterance texts. For example, the utterance analysis unit 120 converts the voice indicating the user utterance of the user 20 acquired in step S26 into second and subsequent utterance texts by voice recognition. Then, the speech analysis unit 120 divides the second and subsequent speech texts into words by morphological analysis.

[ステップS28]単語解析部130は、欠落伝達要素があるか否かを判定する。単語解析部130は、伝達要素情報113から、カテゴリの項目に発話テキストのカテゴリが設定され、伝達要素の項目に欠落伝達要素情報115から特定された伝達要素のいずれかが設定されたレコードを抽出する。単語解析部130は、抽出されたレコードのうち、単語の項目に発話テキストおよび二回目以降の発話テキストに含まれる単語が設定されていないレコードの、伝達要素の項目に設定された伝達要素を二回目以降の発話テキストの欠落伝達要素として特定する。単語解析部130は、二回目以降の発話テキストの欠落伝達要素が特定された場合、欠落伝達要素があると判定し、二回目以降の発話テキストの欠落伝達要素が特定されなかった場合、欠落伝達要素がないと判定する。 [Step S28] The word analysis unit 130 determines whether or not there is a missing conveying element. From the communicative element information 113, the word analysis unit 130 extracts records in which the category item is set to the utterance text category and the communicative element item is set to any of the communicative elements specified from the missing communicative element information 115. do. Among the extracted records, word analysis unit 130 divides the transfer element set in the transfer element field of records in which neither the utterance text nor words included in the second and subsequent utterance texts are set in the word field. Identify it as a missing transfer element in the utterance text after the first time. The word analysis unit 130 determines that there is a missing communication element when the missing communication element is identified in the second and subsequent utterance texts, and determines that there is a missing communication element when the missing communication element is not identified in the second and subsequent utterance texts. Determine that there are no elements.

単語解析部130は、欠落伝達要素があると判定した場合、処理をステップS29に進める。また、単語解析部130は、欠落伝達要素がないと判定した場合、処理をステップS32に進める。 When word analysis unit 130 determines that there is a missing conveying element, the process proceeds to step S29. On the other hand, when word analysis section 130 determines that there is no missing transfer element, the process proceeds to step S32.

[ステップS29]単語解析部130は、欠落伝達要素に対応する欠落単語を特定する。例えば、単語解析部130は、欠落伝達要素情報115から、カテゴリの項目に発話テキストのカテゴリが設定され、欠落伝達要素の項目に二回目以降の発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、単語解析部130は、特定したレコードの欠落単語の項目に設定された単語を欠落伝達要素に対応する欠落単語として特定する。 [Step S29] The word analysis unit 130 identifies missing words corresponding to missing transfer elements. For example, from the missing communicative element information 115, the word analysis unit 130 identifies a record in which the utterance text category is set in the category item and the missing communicative element of the utterance text for the second time or later is set in the missing communicative element item. do. Then, the word analysis unit 130 identifies the word set in the missing word item of the identified record as the missing word corresponding to the missing communicative element.

[ステップS30]応答生成部140は、発話テキストの欠落伝達要素に対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に二回目以降の発話テキストの欠落伝達要素が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。 [Step S30] The response generation unit 140 selects a standard sentence corresponding to the missing transfer element of the utterance text. For example, from the standard sentence information 116, the response generation unit 140 sets the category of the spoken text to the item of category, sets the intention of the spoken text to the item of intention, and sets the second and subsequent spoken texts to the item of the missing communication element. Identify records with missing propagating elements of Then, the response generating unit 140 selects the fixed phrase set in the fixed phrase field of the identified record.

[ステップS31]応答生成部140は、定型文、欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語(抽出単語)から二回目以降の応答を生成し、出力する。例えば、応答生成部140は、ステップS30で選択された定型文の空欄に、ステップS29で特定された欠落単語、発話テキストに含まれる単語および二回目以降の発話テキストに含まれる単語を入れて応答テキストを生成する。応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。そして、処理がステップS24に進む。 [Step S31] The response generation unit 140 generates second and subsequent responses from fixed phrases, missing words, words contained in the utterance text, and words (extracted words) contained in the second and subsequent utterance texts, and outputs them. For example, the response generator 140 responds by inserting the missing words identified in step S29, the words included in the spoken text, and the words included in the second and later spoken texts in the blanks of the standard sentence selected in step S30. Generate text. The response generation unit 140 transmits the generated response text to the PC 200 and causes the PC 200 to output a voice indicating the response text. Then, the process proceeds to step S24.

[ステップS32]応答生成部140は、欠落伝達要素なしに対応する定型文を選択する。例えば、応答生成部140は、定型文情報116から、カテゴリの項目に発話テキストのカテゴリが設定され、意図の項目に発話テキストの意図が設定され、欠落伝達要素の項目に「-」が設定されたレコードを特定する。そして、応答生成部140は、特定したレコードの定型文の項目に設定された定型文を選択する。 [Step S32] The response generation unit 140 selects a fixed phrase corresponding to no missing conveying element. For example, from the standard sentence information 116, the response generation unit 140 sets the utterance text category in the category item, sets the intention of the utterance text in the intention item, and sets "-" in the missing communication element item. identify the record that was Then, the response generating unit 140 selects the fixed phrase set in the fixed phrase field of the identified record.

[ステップS33]応答生成部140は、定型文、発話テキストまたは二回目以降の発話テキストに含まれる単語(抽出単語)から応答を生成し、出力する。例えば、応答生成部140は、ステップS32で選択された定型文の空欄に、発話テキストまたは二回目以降の発話テキストに含まれる単語を入れて応答テキストを生成する。なお、応答生成部140は、アイテム情報117から特定されるアイテムを定型文の空欄に入れてもよい。発話テキストまたは二回目以降の発話テキストと関連する応答生成部140は、生成した応答テキストをPC200に送信し、応答テキストを示す音声をPC200に出力させる。 [Step S33] The response generation unit 140 generates and outputs a response from words (extracted words) included in the standard sentence, the utterance text, or the second and subsequent utterance texts. For example, the response generation unit 140 generates a response text by inserting a word included in the utterance text or the second and subsequent utterance texts in the blanks of the standard sentence selected in step S32. Note that the response generation unit 140 may insert the item specified from the item information 117 into the blank of the fixed phrase. The response generation unit 140 related to the utterance text or the second and subsequent utterance texts transmits the generated response text to the PC 200 and causes the PC 200 to output voice indicating the response text.

このように、応答生成部140は、発話テキストのカテゴリと発話テキストの意図と発話テキストの欠落伝達要素に対応する定型文を選択する。そして、応答生成部140は、欠落単語および発話テキストに含まれる単語を選択した定型文の空欄に入れて応答テキストを生成する。これにより、応答生成部140は、自然な対話によって、ユーザ20に欠落伝達要素に対応する単語を要求できる。よって、応答生成部140は、円滑な対話ができるシステムを実現することができる。また、応答生成部140は、ユーザ20が発話した意図に合わせた応答ができる。 In this way, the response generation unit 140 selects fixed phrases corresponding to the category of the utterance text, the intention of the utterance text, and the missing communication element of the utterance text. Then, the response generation unit 140 inserts the missing words and the words included in the utterance text into the blanks of the selected fixed phrase to generate a response text. Accordingly, the response generation unit 140 can request the user 20 for the word corresponding to the missing conveying element through natural dialogue. Therefore, the response generator 140 can implement a system that enables smooth dialogue. In addition, the response generator 140 can respond in accordance with the intention of the user 20's utterance.

また、単語解析部130は、発話テキストに含まれる単語から発話テキストのカテゴリを特定する。これにより、単語解析部130は、対話のカテゴリによって変動することがある伝達要素を正確に特定できる。よって、応答生成部140は、正確な欠落伝達要素に対応する単語をユーザ20に要求できる。 The word analysis unit 130 also identifies the category of the spoken text from the words included in the spoken text. This allows the word analysis unit 130 to accurately identify communication elements that may vary depending on the category of dialogue. Therefore, the response generator 140 can request the user 20 for the correct word corresponding to the missing conveying element.

なお、二回目以降の発話テキストは、応答生成部140が出力した応答に対するユーザ20の応答であるため、対話全体のカテゴリを特定できないことが多い。応答生成部140は、発話テキストのカテゴリに基づいた伝達要素のうちの、二回目以降の発話テキストの欠落伝達要素に基づいて定型文を選択することで、適切に二回目以降の応答を生成することができる。よって、応答生成部140は、ユーザ20と複数回のやりとりがある場合も欠落伝達要素をユーザ20に自然に要求できる。 Note that since the second and subsequent utterance texts are the responses of the user 20 to the responses output by the response generation unit 140, it is often impossible to specify the category of the entire dialogue. The response generation unit 140 appropriately generates the second and subsequent responses by selecting fixed form sentences based on the missing communicative elements of the uttered text of the second and subsequent times among the communicative elements based on the category of the uttered text. be able to. Therefore, the response generation unit 140 can naturally request the user 20 for the missing conveying element even when there are multiple interactions with the user 20 .

次に、情報処理装置100が実行する処理の具体例について説明する。
図14は、情報処理装置とユーザとの対話の一例を示す図(その1)である。図14の例では、発話解析部120がユーザ20のユーザ発話を音声認識によって発話テキスト51に変換したものとする。発話テキスト51は、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」というテキストである。発話解析部120は、発話テキスト51を「彼氏」、「と」、「ディナー」、「に」、「着て」、「いく」、「おしゃれ」、「な」、「洋服」、「を」、「調べて」、「なるべく」、「安く」および「て」に単語分割する。
Next, a specific example of processing executed by the information processing apparatus 100 will be described.
FIG. 14 is a diagram (part 1) illustrating an example of interaction between the information processing apparatus and the user; In the example of FIG. 14, the utterance analysis unit 120 converts the user utterance of the user 20 into the utterance text 51 by voice recognition. The utterance text 51 is a text that reads, "Look up fashionable clothes to wear to dinner with your boyfriend, and find them as cheap as possible." The utterance analysis unit 120 converts the utterance text 51 into “boyfriend”, “to”, “dinner”, “ni”, “wear”, “go”, “stylish”, “na”, “clothes”, and “wo”. , "examine", "as much as possible", "cheap" and "te".

次に、単語解析部130は、発話テキスト51に含まれる単語とカテゴリ情報111とから、発話テキスト51のカテゴリを特定する。まず、単語解析部130は、カテゴリ情報111の、「彼氏」、「ディナー」、「おしゃれ」および「洋服」が単語の項目に設定されているレコードを参照する。そして、単語解析部130は、参照したレコードのカテゴリAおよびカテゴリBの項目に設定されている、「ファッション」および「提案」を発話テキスト51のカテゴリとして特定する。 Next, the word analysis unit 130 identifies the category of the spoken text 51 from the words included in the spoken text 51 and the category information 111 . First, the word analysis unit 130 refers to records in the category information 111 in which “boyfriend”, “dinner”, “stylish”, and “clothes” are set as word items. Then, word analysis unit 130 identifies “fashion” and “suggestion” set in items of category A and category B of the referred record as categories of spoken text 51 .

また、単語解析部130は、発話テキスト51に含まれる単語と意図情報112とから、発話テキスト51の意図を特定する。まず、単語解析部130は、意図情報112の、「調べて」が単語の項目に設定されているレコードを参照する。そして、単語解析部130は、参照したレコードの意図の項目に設定されている、「検索」を発話テキスト51のカテゴリとして特定する。 The word analysis unit 130 also identifies the intention of the spoken text 51 from the words included in the spoken text 51 and the intention information 112 . First, the word analysis unit 130 refers to the record in the intention information 112 in which “examine” is set in the word item. Then, the word analysis unit 130 identifies “search” set in the intention item of the referenced record as the category of the spoken text 51 .

次に、単語解析部130は、発話テキスト51の欠落伝達要素と、発話テキスト51の欠落伝達要素に対応する欠落単語を特定する。まず、単語解析部130は、欠落伝達要素情報115の、「ファッション」がカテゴリの項目に設定されているレコードを参照する。単語解析部130は、参照したレコードの伝達要素の項目に設定された、「いつ」、「どこ」、「だれ」および「なに」をカテゴリ「ファッション」に対応する伝達要素として特定する。単語解析部130は、伝達要素情報113の、カテゴリの項目に「ファッション」が設定され、伝達要素の項目に「いつ」、「どこ」、「だれ」および「なに」のいずれかが設定されたレコードを抽出する。 Next, the word analysis unit 130 identifies missing communicative elements of the spoken text 51 and missing words corresponding to the missing communicative elements of the spoken text 51 . First, the word analysis unit 130 refers to records in the missing transferable element information 115 in which “fashion” is set as a category item. Word analysis unit 130 identifies “when”, “where”, “who” and “what” set in the items of the communicative elements of the referenced record as communicative elements corresponding to the category “fashion”. In the communication element information 113, the word analysis unit 130 sets "fashion" as the category item, and sets any of "when", "where", "who", and "what" as the communication element item. to extract the records

ここで、抽出したレコードのうち、伝達要素の項目に「どこ」が設定されているレコードの単語の項目には、「ディナー」が設定され、伝達要素の項目に「だれ」が設定されているレコードの単語の項目には、「彼氏」が設定されている。また、抽出したレコードのうち、伝達要素の項目に「なに」が設定されているレコードの単語の項目には、「洋服」が設定され、伝達要素の項目に「いつ」が設定されているレコードの単語の項目には、発話テキスト51に含まれる単語が設定されていない。よって、単語解析部130は、「いつ」を発話テキスト51の欠落伝達要素として特定する。そして、単語解析部130は、欠落伝達要素情報115の、カテゴリの項目に「ファッション」が設定され、欠落伝達要素の項目に「いつ」が設定されたレコードの欠落単語の項目に設定された「いつ頃」を、欠落単語として特定する。 Here, among the extracted records, the word field of the record for which "where" is set in the communication element field is set to "dinner", and "who" is set in the communication element field. "Boyfriend" is set in the word field of the record. In addition, among the extracted records, the word item of the record in which "what" is set in the communication element item is set to "clothes", and the communication element item is set to "when". The word included in the spoken text 51 is not set in the word item of the record. Therefore, the word analysis unit 130 identifies “when” as the missing transfer element of the spoken text 51 . Then, the word analysis unit 130 determines that the missing communicative element information 115 of the record in which the category item is set to "fashion" and the missing communicative element item is set to "when" is set to the missing word item of " when” is identified as a missing word.

次に、応答生成部140は、発話テキスト51の欠落伝達要素「いつ」に対応する定型文を選択する。応答生成部140は、定型文情報116から、カテゴリの項目に「ファッション」が設定され、意図の項目に「検索」が設定され、欠落伝達要素の項目に「いつ」が設定されたレコードの定型文の項目に設定された定型文「[]は[]の予定ですか。」を選択する。 Next, the response generation unit 140 selects a standard sentence corresponding to the missing transfer element “when” in the spoken text 51 . The response generation unit 140 generates a fixed form of a record in which the item of category is set to "fashion", the item of intention is set to "search", and the item of missing communication element is set to "when" from the fixed phrase information 116. Select the fixed phrase "Is [] the plan for []?" set in the sentence item.

そして、応答生成部140は、定型文「[]は[]の予定ですか。」の空欄に、欠落単語および発話テキスト51に含まれる単語を入れて応答テキストを生成する。ここで、定型文「[]は[]の予定ですか。」の1つ目の空欄には伝達要素「どこ」が設定され、2つ目の空欄には、伝達要素「いつ」が設定されているものとする。応答生成部140は、定型文「[]は[]の予定ですか。」の1つ目の空欄に、伝達要素「どこ」に対応する「ディナー」を入れ、2つ目の空欄に欠落伝達要素「いつ」に対応する欠落単語「いつ頃」を入れ、応答テキスト52を生成する。応答テキスト52は、「ディナーはいつ頃の予定ですか。」というテキストである。応答生成部140は、応答テキスト52をPC200に送信し、応答テキスト52を示す音声をPC200に出力させる。 Then, the response generation unit 140 generates a response text by inserting the missing words and the words included in the utterance text 51 into the blanks of the standard sentence "Is [] planned for []?" Here, the communication element "where" is set in the first blank of the fixed phrase "[] is scheduled for []?", and the communication element "when" is set in the second blank. shall be The response generation unit 140 puts “Dinner” corresponding to the communication element “Where” in the first blank of the standard sentence “Are you planning to have [] in []?” The missing word “when” corresponding to the element “when” is inserted to generate the response text 52 . The response text 52 is the text "When do you plan to have dinner?" The response generation unit 140 transmits the response text 52 to the PC 200 and causes the PC 200 to output voice indicating the response text 52 .

図15は、情報処理装置とユーザとの対話の一例を示す図(その2)である。図15の例では、応答テキスト52に対するユーザ20のユーザ発話を、発話解析部120が発話テキスト53に変換したものとする。発話テキスト53は、「今月の30日、私の誕生日だよ。」というテキストである。発話解析部120は、発話テキスト53を「今月」、「の」、「30日」、「私」、「の」、「誕生日」および「だよ」に単語分割する。 FIG. 15 is a diagram (part 2) illustrating an example of interaction between the information processing apparatus and the user. In the example of FIG. 15, it is assumed that the user utterance of the user 20 to the response text 52 is converted into the utterance text 53 by the utterance analysis unit 120 . The utterance text 53 is the text "It's my birthday on the 30th of this month." The speech analysis unit 120 divides the speech text 53 into words of “this month”, “no”, “30th”, “me”, “no”, “birthday” and “dayo”.

次に、単語解析部130は、発話テキスト53の欠落伝達要素と、発話テキスト53の欠落伝達要素に対応する欠落単語を特定する。ここで、伝達要素情報113の、カテゴリの項目に「ファッション」が設定され、伝達要素の項目に「いつ」が設定されたレコードの単語の項目には発話テキスト53に含まれる「誕生日」が設定されている。よって、単語解析部130は、カテゴリ「ファッション」について欠落伝達要素がないことを特定する。そして、単語解析部130は、カテゴリ「提案」について欠落伝達要素を特定する。 Next, the word analysis unit 130 identifies missing communicative elements of the spoken text 53 and missing words corresponding to the missing communicative elements of the spoken text 53 . Here, in the communication element information 113, "fashion" is set in the category item and "when" is set in the communication element item. is set. Therefore, the word analysis unit 130 identifies that there is no missing transfer element for the category "fashion". Then, the word analysis unit 130 identifies missing transferable elements for the category “suggestion”.

単語解析部130は、欠落伝達要素情報115を参照し、「どこ」および「いくら」をカテゴリ「提案」に対応する伝達要素として特定する。ここで、伝達要素情報113には、「どこ」に対応する単語として発話テキスト51に含まれる「おしゃれ」が登録され、「いくら」に対応する単語として発話テキスト51,53に含まれる単語が登録されていない。すると、単語解析部130は、「いくら」を発話テキスト53の欠落伝達要素として特定する。そして、単語解析部130は、欠落伝達要素情報115を参照し、カテゴリ「提案」、欠落伝達要素「いくら」に対応する「予算」を欠落単語として特定する。 The word analysis unit 130 refers to the missing communicative element information 115 and identifies “where” and “how much” as communicative elements corresponding to the category “suggestion”. Here, in the transfer element information 113, "stylish" included in the utterance text 51 is registered as a word corresponding to "where", and words included in the utterance texts 51 and 53 are registered as words corresponding to "how much". It has not been. Then, the word analysis unit 130 identifies “how much” as the missing transfer element of the spoken text 53 . Then, the word analysis unit 130 refers to the missing communicative element information 115 and identifies "budget" corresponding to the category "suggestion" and the missing communicative element "how much" as a missing word.

次に、応答生成部140は、定型文情報116から、カテゴリ「提案」、意図「検索」欠落伝達要素「いくら」に対応する定型文「どれくらいの[]ですか。」を選択する。ここで、定型文「どれくらいの[]ですか。」の空欄には伝達要素「いくら」が設定されているものとする。応答生成部140は、定型文「どれくらいの[]ですか。」の空欄に欠落伝達要素「いくら」に対応する欠落単語「予算」を入れ、応答テキスト54を生成する。応答テキスト54は、「どれくらいの予算ですか。」というテキストである。応答生成部140は、応答テキスト54をPC200に送信し、応答テキスト54を示す音声をPC200に出力させる。 Next, the response generation unit 140 selects from the fixed phrase information 116 the fixed phrase “How long is [ ]?” corresponding to the category “suggestion” and the intention “search” missing conveying element “how much”. Here, it is assumed that the communication element "how much" is set in the blank of the standard sentence "how much [] is it?". The response generation unit 140 generates a response text 54 by inserting the missing word “budget” corresponding to the missing communication element “how much” in the blank of the standard sentence “how much [] is it?”. Response text 54 is the text "What is your budget?" The response generation unit 140 transmits the response text 54 to the PC 200 and causes the PC 200 to output voice indicating the response text 54 .

図16は、情報処理装置とユーザとの対話の一例を示す図(その3)である。図16の例では、応答テキスト54に対するユーザ20のユーザ発話を、発話解析部120が発話テキスト55に変換したものとする。発話テキスト55は、「20000円以内です。」というテキストである。発話解析部120は、発話テキスト55を「20000」、「円」、「以内」および「です」に単語分割する。 FIG. 16 is a diagram (part 3) illustrating an example of interaction between the information processing apparatus and the user. In the example of FIG. 16, it is assumed that the user utterance of the user 20 to the response text 54 is converted into the utterance text 55 by the utterance analysis unit 120 . The utterance text 55 is the text "within 20,000 yen." The utterance analysis unit 120 divides the utterance text 55 into “20000”, “yen”, “within” and “desu”.

ここで、伝達要素情報113には、カテゴリ「提案」、伝達要素「いくら」に対応する単語として、発話テキスト55に含まれる「円」が登録されている。よって、単語解析部130は、カテゴリ「提案」について欠落伝達要素がないことを特定する。これにより、単語解析部130は、カテゴリ「ファッション」および「提案」のいずれについても欠落伝達要素がないことを特定する。なお、単語解析部130は、カテゴリ「ファッション」の伝達要素「いつ」に対応する単語を、発話テキスト53に含まれる「今月」および「30日」から、「10月30日」に変換してもよい。また、単語解析部130は、カテゴリ「提案」の伝達要素「いくら」に対応する単語を、発話テキスト55に含まれる「円」および「円」の前にある数字である「20000」から、「20000円」に変換してもよい。 Here, in the communication element information 113, "yen" included in the spoken text 55 is registered as a word corresponding to the category "suggestion" and the communication element "how much". Therefore, the word analysis unit 130 identifies that there is no missing transfer element for the category “suggestion”. As a result, word analysis section 130 identifies that there is no missing communicative element in any of the categories “fashion” and “suggestion”. Note that the word analysis unit 130 converts the word corresponding to the communication element “when” of the category “fashion” from “this month” and “30th” included in the utterance text 53 to “October 30th”. good too. In addition, the word analysis unit 130 extracts the word corresponding to the conveying element "how much" of the category "suggestion" from "yen" included in the utterance text 55 and the number "20000" preceding the "yen" to " 20000 yen".

次に、応答生成部140は、定型文情報116から、カテゴリ「ファッション」、意図「検索」欠落伝達要素「-」(つまり、欠落伝達要素なし)に対応する定型文「[]は[]です。[]な[]はいかがでしょうか。」を選択する。ここで、定型文「[]は[]です。[]な[]はいかがでしょうか。」の1つ目の空欄には伝達要素「いつ」が設定され、2つ目の空欄には伝達要素「いつ」に関連する単語が設定されているものとする。また、定型文「[]は[]です。[]な[]はいかがでしょうか。」の3つ目の空欄にはカテゴリ「提案」の伝達要素「どこ」が設定され、4つ目の空欄には発話テキストに関連するアイテムが設定されているものとする。 Next, the response generation unit 140, from the fixed phrase information 116, the fixed phrase "[] is []" corresponding to the category "fashion" and the intention "search" missing conveying element "-" (that is, no missing conveying element) How about [ ] [ ]?" is selected. Here, in the fixed phrase "[] is []. How about [] na []?", the communication element "when" is set in the first blank, and the communication element It is assumed that words related to "when" are set. In addition, the third blank of the fixed phrase "[] is []. How about [] na []?" is set with an item related to the spoken text.

応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の1つ目の空欄に伝達要素「いつ」に対応する「10月30日」を入れる。また、応答生成部140は、例えば、日付と単語との対応関係を示すデータベースから、「10月30日」に関連する単語「肌寒い」を特定し、「肌寒い」を定型文「[]は[]です。[]な[]はいかがでしょうか。」の2つ目の空欄に入れる。また、応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の3つ目の空欄にカテゴリ「提案」の伝達要素「どこ」に対応する「おしゃれ」を入れる。また、応答生成部140は、アイテム情報117の単語の項目に、発話テキスト51,53,55に含まれる単語を最も多く含むレコードのアイテムの項目に設定されているアイテムを特定する。これにより、応答生成部140は、アイテム「トレンチコート」を特定する。応答生成部140は、定型文「[]は[]です。[]な[]はいかがでしょうか。」の4つ目の空欄に「トレンチコート」を入れて、応答テキスト56を生成する。応答テキスト56は、「10月30日は肌寒いです。おしゃれなトレンチコートはいかがですか。」というテキストである。応答生成部140は、応答テキスト56をPC200に送信し、応答テキスト56を示す音声をPC200に出力させる。 The response generation unit 140 inserts “October 30” corresponding to the communication element “when” in the first blank of the standard sentence “[] is []. . Further, the response generation unit 140, for example, identifies the word “chilly” related to “October 30th” from the database showing the correspondence between dates and words, and replaces “chilly” with the fixed phrase “[] is [ ]. How about [ ] [ ]?" in the second blank. In addition, the response generating unit 140 inserts "[] is []. How about [][][]?" Enter fashionable. In addition, the response generation unit 140 identifies an item set in the word item of the item information 117 in the item item of the record containing the most words included in the spoken texts 51 , 53 , and 55 . Thereby, the response generator 140 identifies the item "trench coat". The response generation unit 140 generates a response text 56 by inserting “trench coat” in the fourth blank of the standard sentence “[] is []. The response text 56 is the text "October 30th is chilly. Would you like a stylish trench coat?". The response generation unit 140 transmits the response text 56 to the PC 200 and causes the PC 200 to output voice indicating the response text 56 .

なお、定型文「[]は[]です。[]な[]はいかがでしょうか。」には、検索処理が対応付けられていてもよい。そして、応答生成部140は、PC200に、伝達要素「いくら」に対応する「20000円」およびアイテム「トレンチコート」を用いたインターネット検索を実行させ、検索結果を表示させてもよい。 It should be noted that search processing may be associated with the fixed phrase "[] is []. How about [] and []?". Then, response generation unit 140 may cause PC 200 to execute an Internet search using "20000 yen" corresponding to the communication element "how much" and the item "trench coat", and display the search results.

図17は、情報処理装置とユーザとの対話の流れの一例を示す図である。発話解析部120は、「彼氏とディナーに着ていくおしゃれな洋服を調べて、なるべく安くて。」という発話テキスト51を取得する。ここで、発話テキスト51には、伝達要素「いつ」および「いくら」に対応する単語が含まれていないため、ユーザ20の要求を満たす応答が困難である。 FIG. 17 is a diagram illustrating an example of the flow of dialogue between the information processing device and the user. The utterance analysis unit 120 acquires the utterance text 51 that reads, "Look for fashionable clothes to wear to dinner with your boyfriend, and get them as cheaply as possible." Here, since the utterance text 51 does not include words corresponding to the communication elements "when" and "how much", it is difficult to give a response that satisfies the user's 20 request.

そこで、応答生成部140は、「ディナーはいつ頃の予定ですか。」という応答テキスト52を出力することで、ユーザ20に伝達要素「いつ」に対応する単語を要求することができる。そして、発話解析部120は、「今月の30日、私の誕生日だよ。」という発話テキスト53を取得する。単語解析部130は、発話テキスト53から伝達要素「いつ」に対応する「10月30日」を特定できる。 Therefore, the response generation unit 140 can request the user 20 for a word corresponding to the communication element "when" by outputting the response text 52 "When are you planning to have dinner?" Then, the utterance analysis unit 120 acquires the utterance text 53 "It's my birthday on the 30th of this month." The word analysis unit 130 can identify “October 30th” corresponding to the communication element “when” from the spoken text 53 .

また、応答生成部140は、「どれくらいの予算ですか。」という応答テキスト54を出力することで、ユーザ20に伝達要素「いくら」に対応する単語を要求することができる。そして、発話解析部120は、「20000円以内です。」という発話テキスト55を取得する。単語解析部130は、発話テキスト55から伝達要素「いくら」に対応する「20000円」を特定できる。 Also, the response generation unit 140 can request the user 20 for a word corresponding to the communication element "how much" by outputting the response text 54 "How much is your budget?" Then, the utterance analysis unit 120 acquires the utterance text 55 of "It is within 20000 yen." The word analysis unit 130 can identify “20000 yen” corresponding to the transfer element “how much” from the spoken text 55 .

そして、応答生成部140は、「10月30日は肌寒いです。おしゃれなトレンチコートはいかがですか。」という応答テキスト56を出力する。このように、応答生成部140は、応答テキスト52,54により欠落伝達要素に対応する単語をユーザ20に要求することで、ユーザ20の要求を満たすことが可能な発話テキスト51に対する応答である応答テキスト56を出力できる。 Then, the response generation unit 140 outputs the response text 56 saying "October 30th is chilly. Would you like a stylish trench coat?". In this way, the response generation unit 140 requests the user 20 for the word corresponding to the missing transfer element by using the response texts 52 and 54, so that the response to the utterance text 51 that can satisfy the request of the user 20 is generated. Text 56 can be output.

第2の実施の形態によれば、情報処理装置100の単語解析部130は、発話テキストから伝達要素それぞれに対応する単語を抽出する。情報処理装置100の応答生成部140は、伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて定型文を選択する。そして、応答生成部140は、発話テキストに含まれる単語と定型文とに基づいた応答を出力する。 According to the second embodiment, the word analysis unit 130 of the information processing apparatus 100 extracts words corresponding to each of the communication elements from the spoken text. The response generation unit 140 of the information processing apparatus 100 selects a fixed phrase based on the missing communicative element for which the corresponding word has not been extracted from the communicative elements. Then, the response generation unit 140 outputs a response based on the words and fixed phrases included in the spoken text.

これにより、情報処理装置100は、自然なやりとりによって欠落伝達要素に対応する単語をユーザ20に要求できる。よって、情報処理装置100は、円滑な対話ができるシステムを実現することができる。 Accordingly, the information processing apparatus 100 can request the user 20 for the word corresponding to the missing conveying element through natural interaction. Therefore, the information processing apparatus 100 can implement a system that enables smooth dialogue.

また、単語解析部130は、発話テキストに含まれる単語からカテゴリを特定し、カテゴリに対応する伝達要素のうちの欠落伝達要素に基づいて定型文を選択する。これにより、情報処理装置100は、正確な欠落伝達要素に対応する単語をユーザ20に要求できる。 Further, word analysis section 130 identifies a category from words included in the spoken text, and selects a fixed phrase based on missing communicative elements among communicative elements corresponding to the category. Thereby, the information processing apparatus 100 can request the user 20 for the word corresponding to the correct missing conveying element.

また、単語解析部130は、発話テキストに含まれる単語からカテゴリを特定する。応答生成部140は、伝達要素のうちの対応する単語が発話テキストから抽出されなかった発話テキストの欠落伝達要素に基づいて定型文を選択し、発話テキストに含まれる単語と定型文とに基づいた応答を出力する。応答生成部140は、二回目以降の発話テキストを取得すると、伝達要素のうちの対応する単語が発話テキストと二回目以降の発話テキストとから抽出されなかった二回目以降の発話テキストの欠落伝達要素に基づいて定型文を選択する。応答生成部140は、発話テキストに含まれる単語と二回目以降の発話テキストに含まれる単語と定型文とに基づいた応答を出力する。これにより、情報処理装置100は、ユーザ20と複数回のやりとりがある場合も欠落伝達要素をユーザ20に自然に要求できる。 In addition, the word analysis unit 130 identifies categories from words included in the spoken text. The response generation unit 140 selects a standard sentence based on the missing communicative element of the utterance text for which the corresponding word of the communicative elements was not extracted from the utterance text, Print the response. When the response generation unit 140 acquires the second and subsequent utterance texts, the response generation unit 140 detects the missing communicative elements of the second and subsequent utterance texts in which the corresponding words in the communicative elements are not extracted from the utterance text and the second and subsequent utterance texts. Choose a boilerplate based on The response generation unit 140 outputs a response based on the words included in the spoken text, the words included in the second and subsequent spoken texts, and the standard sentences. As a result, the information processing apparatus 100 can naturally request the missing transfer element from the user 20 even when the user 20 interacts with the user 20 a plurality of times.

また、単語解析部130は、発話テキストに含まれる単語から意図を特定し、欠落伝達要素と意図とに基づいて定型文を選択する。これにより、情報処理装置100は、ユーザ20が発話した意図に合わせた応答ができる。 The word analysis unit 130 also identifies intentions from words included in the uttered text, and selects fixed phrases based on the missing communicative elements and the intentions. As a result, the information processing apparatus 100 can respond in accordance with the intention of the user 20's utterance.

以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。 Although the embodiment has been exemplified above, the configuration of each part shown in the embodiment can be replaced with another one having the same function. Also, any other components or steps may be added. Furthermore, any two or more configurations (features) of the above-described embodiments may be combined.

1 入力文
2 応答
10 情報処理装置
11 処理部
1 input sentence 2 response 10 information processing device 11 processing unit

Claims (4)

ユーザからの入力文に含まれる単語から複数のカテゴリを特定し、前記入力文と、前記ユーザに対する応答処理の履歴である会話情報と、前記ユーザのインターネットによる閲覧情報とから、前記複数のカテゴリそれぞれの伝達要素それぞれに対応する単語を抽出し、前記伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて、前記複数のカテゴリそれぞれの定型文を選択し、前記入力文に含まれる単語と前記会話情報に含まれる単語と前記閲覧情報に含まれる単語と前記定型文とに基づいた応答を出力する処理部、
を有する情報処理装置。
A plurality of categories are identified from words contained in a sentence input by a user, and each of the plurality of categories is identified from the input sentence, conversation information that is a history of response processing to the user, and browsing information of the user on the Internet. extracting words corresponding to each of the conveying elements of the input sentence, selecting fixed sentences of each of the plurality of categories based on the missing conveying elements for which the corresponding words are not extracted among the conveying elements, and included in the input sentence a processing unit that outputs a response based on the words contained in the conversation information, the words contained in the conversation information, the words contained in the browsing information, and the fixed phrases;
Information processing device having
前記処理部は、前記ユーザからの第1入力文に含まれる単語から前記複数のカテゴリを特定し、前記伝達要素のうちの対応する単語が前記第1入力文と前記会話情報と前記閲覧情報とから抽出されなかった第1欠落伝達要素に基づいて第1定型文を選択し、前記第1入力文に含まれる単語と前記会話情報に含まれる単語と前記閲覧情報に含まれる単語と前記第1定型文とに基づいた第1応答を出力し、前記ユーザからの第2入力文を取得すると、前記伝達要素のうちの対応する単語が前記第1入力文と前記第2入力文と前記会話情報と前記閲覧情報とから抽出されなかった第2欠落伝達要素に基づいて第2定型文を選択し、前記第1入力文に含まれる単語と前記第2入力文に含まれる単語と前記会話情報に含まれる単語と前記閲覧情報に含まれる単語と前記第2定型文とに基づいた第2応答を出力する、
請求項記載の情報処理装置。
The processing unit specifies the plurality of categories from words included in a first input sentence from the user, and the corresponding words among the transfer elements correspond to the first input sentence, the conversation information, and the browsing information. selects a first fixed form sentence based on the first missing transfer element not extracted from the input sentence, the word contained in the conversation information, the word contained in the browsing information, and the first fixed form sentence outputting a first response based on a standard sentence and obtaining a second input sentence from the user, the corresponding words in the transfer elements are the first input sentence, the second input sentence, and the conversation information; selects a second fixed form sentence based on the second missing communication element not extracted from the browsing information and the words contained in the first input sentence, the words contained in the second input sentence, and the conversation information; outputting a second response based on the included words, the words included in the browsing information, and the second fixed phrase;
The information processing apparatus according to claim 1 .
前記処理部は、前記入力文に含まれる単語から意図を特定し、前記欠落伝達要素と前記意図とに基づいて前記定型文を選択する、
請求項1または2記載の情報処理装置。
The processing unit identifies an intention from words included in the input sentence, and selects the fixed form sentence based on the missing communication element and the intention.
3. The information processing apparatus according to claim 1 or 2 .
コンピュータに、
ユーザからの入力文に含まれる単語から複数のカテゴリを特定し、
前記入力文と、前記ユーザに対する応答処理の履歴である会話情報と、前記ユーザのインターネットによる閲覧情報とから、前記複数のカテゴリそれぞれの伝達要素それぞれに対応する単語を抽出し、
前記伝達要素のうちの対応する単語が抽出されなかった欠落伝達要素に基づいて、前記複数のカテゴリそれぞれの定型文を選択し、
前記入力文に含まれる単語と前記会話情報に含まれる単語と前記閲覧情報に含まれる単語と前記定型文とに基づいた応答を出力する、
処理を実行させるプログラム。
to the computer,
Identify multiple categories from the words contained in the input sentence from the user,
Extracting words corresponding to each of the communication elements of each of the plurality of categories from the input sentence, conversation information that is a history of response processing to the user, and the user's browsing information on the Internet,
Selecting fixed phrases for each of the plurality of categories based on missing communicating elements for which corresponding words have not been extracted from the communicating elements;
outputting a response based on the words included in the input sentence, the words included in the conversation information, the words included in the browsing information, and the fixed sentences;
A program that causes an action to take place.
JP2021097444A 2021-06-10 2021-06-10 Information processing device and program Active JP7295445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021097444A JP7295445B2 (en) 2021-06-10 2021-06-10 Information processing device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021097444A JP7295445B2 (en) 2021-06-10 2021-06-10 Information processing device and program

Publications (2)

Publication Number Publication Date
JP2022189081A JP2022189081A (en) 2022-12-22
JP7295445B2 true JP7295445B2 (en) 2023-06-21

Family

ID=84532738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021097444A Active JP7295445B2 (en) 2021-06-10 2021-06-10 Information processing device and program

Country Status (1)

Country Link
JP (1) JP7295445B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117923A (en) 1999-10-21 2001-04-27 Cai Kk Natural word interactive system for computer
JP2005301780A (en) 2004-04-14 2005-10-27 Sony Corp Information processor, information processing method, and program
JP2015069101A (en) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2015069103A (en) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2021018797A (en) 2019-07-23 2021-02-15 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Conversation interaction method, apparatus, computer readable storage medium, and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08255150A (en) * 1995-03-17 1996-10-01 Toshiba Corp Information public offering device and multimodal information input/output system
JP6163143B2 (en) * 2014-08-06 2017-07-12 日本電信電話株式会社 Information providing apparatus, information providing method, and information providing program
JP7174551B2 (en) * 2018-07-23 2022-11-17 ヤフー株式会社 Estimation device, estimation method and estimation program
JP6868175B1 (en) * 2020-03-26 2021-05-12 株式会社鈴康 Programs, information processing methods and information processing systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117923A (en) 1999-10-21 2001-04-27 Cai Kk Natural word interactive system for computer
JP2005301780A (en) 2004-04-14 2005-10-27 Sony Corp Information processor, information processing method, and program
JP2015069101A (en) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2015069103A (en) 2013-09-30 2015-04-13 Necパーソナルコンピュータ株式会社 Information processing device, control method, and program
JP2021018797A (en) 2019-07-23 2021-02-15 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Conversation interaction method, apparatus, computer readable storage medium, and program

Also Published As

Publication number Publication date
JP2022189081A (en) 2022-12-22

Similar Documents

Publication Publication Date Title
JP7498149B2 (en) User Programmable Automated Assistant
JP6993466B2 (en) Providing suggested voice-based action queries
US20210132986A1 (en) Back-end task fulfillment for dialog-driven applications
CN111033492B (en) Providing command bundle suggestions for automated assistants
US10331791B2 (en) Service for developing dialog-driven applications
US20180285595A1 (en) Virtual agent for the retrieval and analysis of information
US9081411B2 (en) Rapid development of virtual personal assistant applications
US8892419B2 (en) System and methods for semiautomatic generation and tuning of natural language interaction applications
US20140337266A1 (en) Rapid development of virtual personal assistant applications
CN113468302A (en) Combining parameters of multiple search queries sharing an interrogation line
JP2008090545A (en) Voice interaction device and method
KR20080017414A (en) Dynamic user experience with semantic rich objects
JP2009528621A (en) Adaptive semantic platform architecture
US20230244855A1 (en) System and Method for Automatic Summarization in Interlocutor Turn-Based Electronic Conversational Flow
KR20160147303A (en) Method for dialog management based on multi-user using memory capacity and apparatus for performing the method
Remael et al. From translation studies and audiovisual translation to media accessibility: Some research trends
WO2016040402A1 (en) Actions on digital document elements from voice
JP2020135135A (en) Dialog content creation assisting method and system
JP2023539232A (en) Conversational syntax using constrained natural language processing to access datasets
JP2007183796A (en) Business evaluation value calculation system
JP7295445B2 (en) Information processing device and program
WO2020121638A1 (en) Information processing device, information processing system, information processing method, and program
US20220207066A1 (en) System and method for self-generated entity-specific bot
JP2020161012A (en) Information processing apparatus, control method and program
CN118202344A (en) Deep learning technique for extracting embedded data from documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230301

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20230301

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230307

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20230314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230522

R150 Certificate of patent or registration of utility model

Ref document number: 7295445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150