CN110235119A

CN110235119A - 信息处理设备、信息处理方法及程序

Info

Publication number: CN110235119A
Application number: CN201780084544.2A
Authority: CN
Inventors: 斋藤真里; 宫崎充弘; 桐原丽子; 八重田寿理
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2017-01-31
Filing date: 2017-10-19
Publication date: 2019-09-13
Also published as: WO2018142686A1; US20210280181A1; JP6958573B2; JPWO2018142686A1; EP3579123A4; EP3579123A1

Abstract

[问题]为了提供一种信息处理设备、信息处理方法和程序，其使得可以根据用户的话语内容以更自然的会话获取用户的偏好信息。[解决方案]提供了一种信息处理设备，该信息处理设备具有：评价提取单元，用于基于用户的与内容有关的话语内容，提取用户对内容的评价；以及生成单元，用于基于所提取的评价来生成问题语音数据，以进一步获取用户对内容的偏好信息。

Description

信息处理设备、信息处理方法及程序

技术领域

本发明涉及信息处理设备、信息处理方法以及程序。

背景技术

近年来，已经提出了一种分析用户的话语声音并提供针对用户询问的信息的声音代理***的技术。在这样的声音代理***中，可以从用户的询问内容获取用户的偏好信息，例如用户的兴趣。

作为用于获取用户对内容的偏好信息的技术，例如，下面的专利文献1公开了一种用于收集用于广播的观看者反馈并且使用该反馈生成对广播的评级的技术。

引用列表

专利文献

专利文件1：日本专利申请特许公开第2010-252361号

发明内容

本发明要解决的问题

然而，由于上述专利文献1中公开的技术在内容观看结束之后立即向用户提供问卷，因此可能妨碍用户的观看感或听后感。

因此，本公开内容提出了一种信息处理设备、信息处理方法和程序，该信息处理设备能够根据用户的话语内容以更自然的会话获取用户的偏好信息。

技术问题的解决方案

根据本公开内容，提出了一种信息处理设备，该信息处理设备包括：评价提取单元，其基于与内容有关的用户的话语内容，提取用户对所述内容的评价；以及生成单元，其基于所提取的评价来生成用于进一步获取用户对内容的偏好信息的询问声音数据。

根据本公开内容，提出了一种信息处理方法，该信息处理方法包括：由处理器基于与内容有关的用户的话语内容，提取用户对所述内容的评价；以及基于所提取的评价来生成用于进一步获取用户对所述内容的偏好信息的询问声音数据。

根据本公开内容，提出了一种程序，该程序用于使计算机充当：评价提取单元，其基于与内容有关的用户的话语内容来提取用户对所述内容的评价；以及生成单元，其生成用于进一步获取用户对所述内容的偏好信息的询问声音数据。

本发明的有益效果

如上所述，根据本公开内容，可以根据用户的话语内容以更自然的会话获取用户偏好信息。

注意，上述效果不一定是限制性的，并且本说明书中示出的任何效果或可以从本说明书理解到的其他效果可以与上述效果一起展现或者代替上述效果。

附图说明

图1是示出根据本公开内容的实施方式的信息处理***的概况的图。

图2是示出根据本实施方式的代理装置的配置的示例的框图。

图3是示出根据本实施方式的服务器的配置的示例的框图。

图4是示出根据本实施方式的声音代理的响应处理的流程图。

图5是示出根据本实施方式的要评价的内容的检测处理的流程图。

图6是示出根据本实施方式的评价提取处理的流程图。

图7是示出根据本实施方式的代理立场设置处理的流程图。

具体实施方式

下面将参照附图详细描述本公开内容的优选实施方式。注意，在本说明书和附图中，将相同的附图标记赋予具有基本相同的功能配置的构成元件，并且省略冗余的说明。

此外，将按以下顺序进行说明。

1.根据本公开内容的实施方式的信息处理***的概述

2.配置

2-1.代理装置1的配置

2-2.服务器2的配置

3.操作处理

3-1.响应处理

3-2.代理立场设置处理

4.补充

5.结论

<<1.根据本公开内容的实施方式的信息处理***的概述>>

图1是示出根据本公开内容的实施方式的信息处理***的概况的图。在根据本实施方式的信息处理***中，代理装置1可以根据用户的话语内容通过更自然的会话获取用户的偏好信息。

代理装置1具有声音输出单元(扬声器)和声音输入单元(麦克风)，并且具有收集用户在周边的话语声音并且输出响应声音的声音代理功能。根据本实施方式的信息处理***可以是例如包括如图1所示的代理装置1和服务器2的客户端服务器类型，并且可以在服务器2侧执行对话语声音的分析和对响应声音的生成。代理装置1通过有线或无线可通信地连接至网络上的服务器2、发送所收集的话语声音(原始数据或经过诸如对特征量的提取的预定处理的处理数据)，或通过声音输出从服务器2接收到的响应声音。

此外，代理装置1的外观不限于图1所示的示例。在图1中，作为示例，代理装置1简单地形成为圆柱形状，并且设置有发光单元(或显示单元)，例如侧表面上的发光二极管(LED)。

(背景)

此处，在传统的声音代理***中，尽管可以从用户的询问内容中获取诸如用户的兴趣的用户偏好信息，但是很难以自然会话自发地获取更多数量的偏好信息和判定的偏好信息。通常，用户很少单独说出与内容有关的话语，并且用户在与多个用户进行对话的同时谈论内容是很自然的。在内容观看等之后立即通过声音代理向用户单方面地询问内容不能被称为自然会话情况，并且可能干扰观看后的感觉。

因此，根据本公开内容的信息处理***在用户(一个或多个)正在执行与内容有关的会话时自然地参与会话并且输出用于获取用户的与内容有关的偏好信息的询问声音数据。

例如，如图1所示，当正在观看显示装置3上的旅游节目的用户A和用户B正在谈论旅游节目中的特色地点并且说“这个地方不错”和“我希望我们可以去那里”时，服务器2基于由代理装置1收集的会话内容和从内容数据库(DB)4获取的旅游节目的元数据来提取与评价对象(内容)有关的评价。

例如，在旅游节目涉及“普吉岛”的情况下，服务器2从用户A的话语声音中提取用户A对普吉岛的肯定评价，即“这个地方不错”，并且进一步从同意用户A的用户B的话语声音中提取用户B对普吉岛的肯定评价，即“我希望我们可以去那里”。然后，服务器2累积这些评价作为偏好信息，并且进一步输出用于从代理装置1获取与内容有关的更详细的偏好信息(用户喜欢普吉岛的哪些特征(例如，“让我知道您喜欢什么特定的特征？”))的询问声音。由于用户进行有关内容的会话，因此可以预期用户也自然地响应来自代理装置1的询问声音。此外，服务器2还可以通过向询问声音添加与用户评价有同感的行(例如，“这个地方真不错”)来增强与用户的会话。

注意，与上述用户的响应是示例，并且服务器2可以通过增强用户的模糊会话来更可靠地获取偏好信息。

上面已经描述了根据本公开内容的实施方式的信息处理***。随后，将参照附图描述根据本实施方式的信息处理***中包括的每个设备的具体配置。

<<2.配置>>

<2-1.代理装置1的配置>

图2是示出根据本实施方式的代理装置1的配置的示例的框图。如图3所示，代理装置1具有控制单元10、通信单元11、声音输入单元12、摄像装置13、生物传感器14、声音输出单元15、投影仪16和存储器单元17。

控制单元10用作操作处理设备和控制装置，并且根据各种程序控制代理装置1中的整体操作。控制单元10例如由诸如中央处理单元(CPU)或微处理器的电子电路来实现。此外，控制单元10可以包括存储要使用的程序、操作参数等的只读存储器(ROM)以及暂时存储适当变化的参数的随机存取存储器(RAM)等。

根据本实施方式的控制单元10控制通信单元11将从声音输入单元12、摄像装置13和生物传感器14输入的信息经由网络5发送至服务器2。此外，控制单元10具有以下音频代理功能：通过声音从声音输出单元15输出从服务器2接收到的话语声音数据。此外，控制单元10可以从投影仪16投影从服务器2接收到的图像数据以呈现信息。此外，控制单元10可以经由通信单元11连接至诸如家庭Wi-Fi的家庭网络，用于根据来自用户的请求在房间中的显示装置上显示呈现信息、播放来自音频装置等的音乐、指示电视记录器进行录像保留，或控制空调设施。

通信单元11通过有线或无线连接至网络5，并且向网络上的服务器2发送数据和从服务器2接收数据。通信单元11例如通过有线/无线局域网(LAN)、Wi-Fi(注册商标)、移动通信网络(长期演进(LTE))、第三代移动通信***(3G)等连通地连接至网络5。此外，例如，通信单元11还可以通过Wi-Fi等连接至家庭网络，或者通过蓝牙(注册商标)等连接至***的外部装置。

声音输入单元12由麦克风、用于放大和处理由麦克风获取的声音信号的麦克风放大器单元和用于数字转换为声音信号的A/D转换器来实现，并且将声音信号输出至控制单元10。声音输入单元12由例如全向麦克风实现，并且收集周边的用户的话语声音。

摄像装置13具有包括成像透镜的透镜***、使得透镜***进行操作的驱动***、对由透镜***获得的成像光进行光电转换以生成成像信号的固态成像元件阵列等。固态成像装置阵列可以通过例如电荷耦合器件(CCD)传感器阵列或互补金属氧化物半导体(CMOS)传感器阵列来实现。摄像装置13捕获例如用户的面部图像(表情)。

生物传感器14具有通过接触或非接触来获取用户的生物信息的功能。生物传感器的配置不受特别限制。然而，非接触式生物传感器的示例包括使用无线电波检测脉搏或心率的传感器。

声音输出单元15具有用于再现声音信号的扬声器以及用于该扬声器的放大器电路。声音输出单元15由例如全向扬声器实现，并且输出代理的声音。

投影仪16具有将图像投影在墙壁或屏幕上的功能。

存储单元17由存储将在控制单元10的处理中使用的程序、操作参数等的只读存要储器(ROM)以及临时存储适当变化的参数的随机存取存储器(RAM)等实现。

上面具体地描述了根据本实施方式的代理装置1的配置。注意，代理装置1的配置不限于图2所示的示例。例如，代理装置1可以被配置成不具有摄像装置13、生物传感器14或投影仪16。

<2-2.服务器2的配置>

图3是示出根据本实施方式的服务器2的配置的示例的框图。如图3所示，服务器2具有控制单元20、通信单元21、用户信息数据库(DB)22、评价词DB 23、询问话语句子DB 24和代理的立场DB 25。

(控制单元20)

控制单元20用作操作处理装置和控制装置并且根据各种程序来控制服务器2中的整体操作。控制单元20例如由诸如中央处理单元(CPU)或微处理器的电子电路来实现。此外，控制单元20可以包括存储要使用的程序、操作参数等的只读存储器(ROM)以及暂时存储适当变化的参数的随机存取存储器(RAM)等。

此外，根据本实施方式的控制单元20还用作声音识别单元201、用户状态识别单元202、话语分析单元203、内容检测单元204、评价提取单元205、内容偏好管理单元206、话语生成单元207、立场设置单元208和输出控制单元209。

声音识别单元201执行对由代理装置1收集的用户的经发送的话语声音的识别处理(转换为文本)并且将识别结果(用户话语声音文本)输出至话语分析单元203。

用户状态识别单元202基于由代理装置1获取的用户的捕获图像和生物信息来识别用户的状态(动作、移动、视线、表情、情绪等)并且将识别结果输出至内容检测单元204和评价提取单元205。注意，用户的捕获图像可以由安装在用户周围的摄像装置捕获并且由代理装置1经由家庭网络来获取。

话语分析单元203分析由声音识别单元201识别的用户话语声音文本。例如，话语分析单元203可以通过形态分析或词性(part-of-speech)分解将声音文本划分成词，并且通过句法分析、上下文分析、语义分析等来解释句子的含义。

内容检测单元204具有基于话语分析单元203的分析结果来检测(指定)用户的话语声音中的评价对象(内容)的功能。例如，在内容查看期间在用户的会话中存在指示评价对象的词(例如，诸如“这个戏剧”、“这个地方”、“这个”、“那个”的指示代词)，内容检测单元204可以参考正在再现的内容(视频、音乐、电视节目等)的信息，以指定要评价的内容。可以从代理装置1获取与正在再现的内容相关联的信息，或者可以从网络上的内容DB 4获取与正在再现的内容相关联的信息。

此外，内容检测单元204可以根据用户的话语声音来指定要评价的内容，并且还可以考虑诸如用户的姿势和视线的用户状态来指定要评价的内容。例如，在用户手指指向某物品在会话中说“我喜欢这个”、“这是我最喜欢的”等的情况下，基于话语分析单元203的分析结果和用户状态识别单元202的识别结果，内容检测单元204将由用户指向的对象、由用户抓住的对象或用户的视线所指向的对象检测作为要评价的内容。此外，在多个用户处于会话中的情况下，可以将由他们中的任何人握住的对象或多个用户的视线所指向的对象检测作为要评价的内容。

评价提取单元205基于话语分析单元203的分析结果或用户状态识别单元202的识别结果来提取评价。具体地，评价提取单元205从由话语分析单元203分析的词中提取预定的形容词、副词、感叹词等作为评价词，并且确定用户对内容的肯定评价和否定评价。评价提取单元205对评价的提取不限于肯定/否定的二元确定，而且可以确定程度(换句话说，肯定程度或否定程度)。此外，可以在评价词DB 23中预先登记评价词，或者可以从用户的过去的措辞中提取评价词。此外，评价提取单元205可以在会话期间从用户的面部表情(面部图像识别)或情绪(生物信息或面部图像识别)中提取评价。例如，评价提取单元205在用户在观看内容时皱眉的情况下确定为否定评价，并且在用户在观看内容时微笑的情况下确定为肯定评价。

此外，在其他用户表示赞成一个用户的评价的情况下，评价提取单元205可以通过考虑其他用户执行相同评价来登记偏好信息。

·对话示例(在同意的情况下)

用户A：“嘿，这是”(指着某物品或朝着一个人的眼睛。服务器2标识内容)

用户B：“哦，不错啊”(服务器2登记肯定评价)

用户A：“对，难道不是吗？”(由于用户A同意，因此服务器2登记肯定评价)

代理：“○○(指定的内容)不错，对吗？”/“○○，让我知道您喜欢什么特征？”

·对话示例(在不同意的情况下)

用户B：“哦，不错啊”(服务器2登记肯定评价)

用户A：“嗯，我不这么认为”(由于用户A不同意，因此服务器2登记否定评价)

代理：“A，让我知道您不喜欢○○(指定的内容)的原因？”(向用户A询问评价原因)

用户A：“因为......“(原因)””(服务器2登记用户A的评价原因)

代理：“B，让我知道您喜欢○○(指定的内容)的什么特征？”(向用户B询问评价原因)

用户B：“因为......“(原因)””(服务器2登记用户B的评价原因)

代理：“我明白了。顺便问一下，□□□怎么样？”(服务器2询问相关内容的评价并且继续会话。)

内容偏好管理单元206管理在用户信息DB 22中存储的用户对内容的偏好信息(内容偏好)。具体地，内容偏好管理单元206将由评价提取单元205提取的对由内容检测单元204检测到的内容(评价对象)的用户评价存储在用户信息DB 22中。

根据话语分析单元203的分析结果，话语生成单元207生成代理对用户的话语的响应话语声音数据。此外，话语分析单元203可以生成用于进一步获取与用户处于会话中的内容有关的用户偏好信息的询问话语声音数据。例如，话语分析单元203基于用户评价来生成用于进一步获取偏好信息的询问话语。具体地，在用户评价是肯定评价的情况下，话语分析单元203示出肯定的同感(empathy)并且询问评价的原因。此外，在用户评价是否定评价的情况下，话语分析单元203示出否定的同感并且询问评价的原因。此外，话语分析单元203可以生成填充与内容有关的缺失的用户偏好信息(项)的询问话语。可以从内容偏好管理单元206获取缺失的项。此外，话语生成单元207可以在评价的确定程度低(评价是模糊的)的情况下生成使得评价更可靠的询问话语(用户是否真的喜欢或不喜欢内容)。例如，在仅通过观看美食节目的多个用户的以下对话内容难以确定偏好的情况下，执行用于确定评价的询问。

·对话示例(在观看美食节目时)；

用户A：“哇，快看。这个”

用户B：“这是什么？哇，真是太豪华了”

用户A：“好棒啊”

代理：“寿司看起来很美味。您喜欢寿司吗？”(在从美食节目的元数据获得评价对象即“寿司”并且即使肯定评价的概率高也不能判定评价的情况下，执行询问)

用户A：“我喜欢。”

用户B：“我不喜欢。”

代理：“我明白了。B先生/女士，让我知道您为什么不喜欢寿司。”(“喜欢寿司”被登记为用户A的偏好信息，“不喜欢寿司”被登记为用户B的偏好信息，并且进一步继续用于获取偏好信息的询问)

用户B：“我不喜欢生鱼。用煮熟原料做出的寿司是可以的”

代理：“我明白了。A先生/女士，让我知道您喜欢什么样的寿司？”(“不喜欢生鱼”和“用熟原料做的寿司是可以的”被新登记为用户B的偏好信息。之后继续询问)

此外，话语生成单元207参考例如在询问话语句子DB 24中登记的询问话语模板等来生成询问话语声音数据。替选地，话语生成单元207可以使用预定算法来生成询问话语声音数据。

此外，当生成询问声音数据时，话语生成单元207可以添加用于与用户的评价有同感的行以生成话语声音数据。例如，当用户的评价为肯定时，可以有肯定同感，而当用户的评价为否定时，可以有否定同感。例如，在用户进行肯定评价的情况下，可以进行为“很好”的肯定同感，在用户执行否定评价的情况下，可以将否定评价执行为“不好”。此外，此时，可以根据评价词的词性或词的类型预先定义同感的行。例如，可以定义响应，使得在用户说出“好(nice)”的情况下，进行“你是对的”的响应，并且在用户说出“好棒”的情况下，进行“真的很棒”的响应。此外，话语生成单元207可以询问用户进行肯定/否定评价的原因。例如，在用户对内容执行肯定/否定评价的情况下，进行“真的吗？为什么？”的响应,以询问原因。与用户的评价有同感或执行对原因的询问可以增强用户的会话并且可以进一步听到偏好信息。例如，话语生成单元207可以做出响应以问询对与用户正在评价的内容有关的内容的评价。例如，在用户对艺术家X的音乐执行肯定评价的情况下，“是的。艺术家Y的○○(歌曲名称)也很好，对吧？”，使得也可以获取对艺术家Y的用户评价。

此外，话语生成单元207可以在关于内容进行对话的多个用户的评价彼此匹配的情况下指示对评价原因的同感或询问，并且话语生成单元207可以在多个用户的评价彼此不匹配的情况下向用户中的任一用户询问评价的原因。

·对话示例(在评价彼此匹配的情况下)

用户A：“这个不错，”(在观看化妆品的CM时)

用户B：“我也这么认为”

代理：“很好”/“是○○(化妆品产品名称)么？让我知道你们喜欢它什么特征？”

·对话示例(在评价彼此不匹配的情况下)

用户A：“这个不错，”(在观看化妆品的CM时)

用户B：“我不这样认为”

代理：“是○○(化妆品产品名称)么？B先生/女士，您为什么不喜欢它？”

此外，在关于内容进行对话的多个用户中存在没有进行评价的用户的情况下，话语生成单元207可以执行用于敦促用户说出的响应。例如，假设以下对话示例。

·对话示例(在观看旅游节目之后)

用户A：“普吉岛很好”

(服务器2从节目的元数据中理解用户观看的旅游节目的内容与普吉岛有关，并且指定要评价的内容是“普吉岛”。)此外，用户A对普吉岛的肯定评价被登记。

用户B：“是的，我希望我们可以去那里”

(服务器2针对同一目标提取与用户A的肯定评价相同的肯定评价，并且将评价登记为用户B的偏好信息)

(服务器2从用户A和用户B的视线或话语间隔检测会话继续的意图，将其确定为要说出的定时，并且生成和输出询问话语语音数据。具体地，服务器2表示同感，因为多个用户的评价彼此匹配，并且针对对话中未出现的评价原因进行询问。)

代理：“普吉岛很有吸引力。让我知道你们喜欢什么特征？”

用户A：“因为看起来我可以在那里得到放松”(服务器2登记用户A的偏好信息(用户A喜欢普吉岛的原因))

代理：“B先生/女士也这么认为吗？”(服务器2敦促用户B说话，因为用户B没有回答)

用户B：“我认为是因为美食”

(服务器2登记用户B的偏好信息(用户B喜欢普吉岛的原因))

(服务器2预测会话将继续，并且因为存在间隔，确定该间隔是要说出的定时)

代理：“美食很吸引人，对吗？”

用户A：“你现在要去吃饭吗？”

(服务器2等待下一个话语，因为这不是关于内容的话语)

此外，在设置代理立场的情况下，话语生成单元207可以考虑代理立场来响应。具体地，在代理立场与用户的评价匹配的情况下，话语生成单元207可以表示同感，并且在代理立场不同于用户的评价的情况下，话语生成单元207可以问询评价的原因。因此，通过对正在进行不同评价的用户中的每一个表示出同感，可以避免矛盾。

此外，话语生成单元207可以生成具有不同粒度(类别或分类)的问题，以进一步获取偏好信息。例如，除了关于上述内容本身的询问之外，还可以生成关于内容的类别本身的询问以及关于内容的元数据(具体地，未在用户信息DB 22中登记的信息)的询问。例如，在内容是戏剧的情况下，话语生成单元207可以还询问除了对戏剧的评价原因之外的对戏剧的种类的偏好，例如，“你喜欢犯罪剧吗？”、“你喜欢医疗剧吗？”等。此外，话语生成单元207可以针对戏剧的元数据进行询问，即，角色、背景音乐、背景、原作者等的偏好，例如，“你喜欢主角的演员吗？”、“你喜欢主题曲吗？”、“你喜欢年龄设置吗？”、“你喜欢原作者吗？”等。

此外，话语生成单元207可以设置询问次数的上限，以避免以持久的方式问询问题。此外，话语生成单元207可以在询问时基于用户的反应(侧视、沉默、做出厌恶的表情等)来确定是否继续询问。

此外，话语生成单元207可以生成用于以多模式表达获取用户的反应的询问。具体地，例如，话语生成单元207可以参考所设置的代理立场，并且讲出敦促会话的代理的意见，或者可以呈现未参与该对话的其他人的意见(其他家庭成员的过去的讲话、其他人在互联网上的评论等)，以敦促会话(例如，“C说“......”，但你觉得呢，A先生/女士？”等)。

此外，在用户表示否定评价的情况下，话语生成单元207不仅可以问询评价的原因，还可以清楚地指示其他内容并且问询评价。以下是对话示例。

·对话示例(在观看度假村特色的节目时)

用户A：“我真的不喜欢海滩度假村”

(服务器将用户A对海滩度假村的否定评价登记为用户A的偏好信息，并且执行对评价原因的询问以及用于获取对其他内容的反应的询问。

代理：“这样子，为什么？您对世界遗产感兴趣吗？”

立场设置单元208具有设置代理的立场的功能。代理立场是代理的偏好信息，可以将代理立场设置为对内容进行肯定评价的立场，或者将代理立场设置为进行行否定评价的立场(代理的角色设置)。设置的代理立场的信息被存储在代理立场DB 25中。此外，立场设置单元208可以使与用户的对话影响代理立场以逐渐改变代理立场。例如，在不是偏好的内容的立场的情况下，立场设置单元可以问询用户进行肯定评价的原因，在继续与用户的会话的同时改变立场，并且响应为“我明白了。现在我有点喜欢它”。

输出控制单元209具有以下功能：控制由话语生成单元207生成的话语声音数据通过来自代理装置1的声音来输出。具体地，输出控制单元209可以将话语声音数据从通信单元21发送至代理装置1并且指示代理装置1输出声音。此外，输出控制单元209还可以控制代理装置1在预定定时处输出声音。例如，输出控制单元209可以在多个用户的会话被激发的情况下不执行询问(在笑声未中断，语音音量大，会话期间，会话的间隔短，会话节奏快等的情况下)，并且当会话稳定时(例如，在会话的间隔变为预定长度的情况下等)，输出控制单元209可以执行询问。此外，在不激发会话的情况下，会话的节奏很差，并且会话趋于被中断，输出控制单元209可能不执行询问并且在下次定时良好时输出询问。例如，当稍后执行询问时，输出控制单元209可以在用户没有忘记内容体验的定时处(例如在从内容体验起的一天内)执行询问，或可以在用户放松或不忙的情况下询问如“让我知道您喜欢您之前谈过的○○○(内容)的什么特征？、“让我知道您不喜欢您前几天看过的○○○原因”等。此外，当用户询问日程安排、新闻等时，输出控制单元209可以执行询问以及响应。例如，响应于来自用户的日程安排请求(“今天的日程安排是什么？”)，输出控制单元209可以响应为“今天的日程安排是从○点开始的○○”。说到这一点，您前几天谈过的□□□真的好。”，并且针对评价模糊的内容获取更可靠的偏好信息。

(通信单元21)

通信单元21通过有线或无线连接至网络5，并且经由网络5向代理装置1发送数据并且从代理装置1接收数据。通信单元21例如通过有线/无线局域网(LAN)、无线保真(Wi-Fi，注册商标)等连通地连接至网络5。

上面已经具体描述了根据本实施方式的服务器2的配置。注意，根据本实施方式的服务器2的配置不限于图3所示的示例。例如，可以在外部装置中提供服务器2的配置的一部分。此外，代理装置1可以具有服务器2的控制单元20的功能配置的部分或全部。

<<3.操作处理>>

随后，将参照图4至图7具体描述根据本实施方式的信息处理***的操作处理。

<3-1.响应处理>

图4是示出根据本实施方式的声音代理的响应处理的流程图。如图4所示，首先，服务器2使声音识别单元201对由代理装置1收集的用户对话声音执行声音识别(步骤S104)并且使话语分析单元203执行话语分析(步骤S106)。

接下来，服务器2的控制单元20确定用户的对话内容是否是与内容(一些评价目标)有关的话语(步骤S109)。

接下来，在话语与内容有关(步骤S109/是)的情况下，服务器2的控制单元20使内容检测单元204基于话语内容、用户的姿势、视线等检测(指定)要评价的内容(步骤S112)。

此外，控制单元20使评价提取单元205从话语内容、表情等提取对内容的肯定/否定评价(或评价原因等)作为偏好信息(步骤S115)。指示肯定/否定的评价词预先登记在评价词DB 23中，并且评价提取单元205可以参考评价词DB 23并分析在用户话语中包含的评价词以提取评价，或者可以每次使用用于识别的算法。此外，除了对用户话语的分析之外，评价提取单元205还可以通过参考用户的表情或情绪(可以从表情或生物信息获取)来提取用户对内容的肯定/否定评价。

接下来，内容偏好管理单元206更新在用户信息DB 22中存储的用户偏好信息(即，关于内容的用户偏好的信息)(步骤S118)。

接下来，内容偏好管理单元206确定用户偏好信息中是否存在不足的信息(数据项)(步骤S121)。

接下来，在存在不足的信息(步骤S121/是)的情况下，如果处于要说出的情况(步骤S124/是)，则服务器2的控制单元20通过话语生成单元207生成询问话语并且使输出控制单元209执行控制，使得从代理装置1输出询问话语(步骤S127)。基于例如用户的状态(视线或动作)、话语的间隔、兴奋程度等来确定是否处于要说出的情况。此外，此处，尽管用于获取在用户信息DB 22中登记的用户的偏好信息之中的不足的信息(项)的询问话语被生成，以作为示例，但是本公开内容不限于此。例如，话语生成单元207可以在步骤S112中无法检测到内容的情况下(例如，由于模糊的表情而无法识别)或者在步骤S115中无法提取评价的情况下(例如，由于模糊的表情而无法判定)生成用于确定内容或评价的询问话语(例如，“是○○(内容)吗？”、“您喜欢○○(内容)吗？”等)。

另一方面，在不存在内容的偏好信息不足(步骤S121/否)的情况下，如果处于要说出的情况(步骤S130)，则服务器2生成表示同感和/或敦促下一个话语的话语的响应，并且输出响应和/或话语(步骤S133)。下一个话语是例如用于问询对与要评价的内容有关的其他内容的偏好信息的询问话语(例如，“您喜欢○○(内容)。□□(有关其他内容)怎么样？”等)。

注意，在上述步骤S124至S133中，在确定是否处于要说出的情况之后生成询问话语。然而，本实施方式不限于此，并且首先，话语生成单元207可以生成询问话语，并且输出控制单元209可以在等待说出(可以设置等待时间的上限)的情况之后执行输出控制。

然后，当从用户发出新的话语(步骤S136/是)时，重复从步骤S103起的处理。

此外，在未处于要说出的情况(步骤S124/否，步骤S130/否)的情况下，结束响应处理(等待新的话语)。

(要评价的内容的检测处理)

接下来，将参照图5详细描述步骤S112中所示的要评价的内容的检测处理。图5是示出根据本实施方式的要评价的内容的检测处理的流程图。

如图5所示，首先，服务器2的内容检测单元204确定在所分析的用户话语中是否存在指示内容的词(步骤S153)。

接下来，在存在指示内容的词(步骤S153/是)的情况下，内容检测单元204确定该词是否在内容DB 4中(步骤S156)。内容DB 4可以是在外部服务器中提供的程序信息数据库，或者可以是服务器2具有的内容词典数据库(预先登记内容的名称的数据库，未示出)。

接下来，在词在内容DB 4中(步骤S156/是)的情况下，内容检测单元204指定要评价的内容(步骤S159)。注意，内容检测单元204可以根据需要从内容DB 4获取指定内容的信息。

另一方面，在话语中不存在指示内容的词(步骤S153/否)的情况下或在指示内容的词是指示性的词(步骤S162/是)的情况下，内容检测单元204基于用户状态的识别结果来检测用户的视线(步骤S165)，检测手指指向(步骤S168)或检测要握住的对象(步骤S171)并且指定由用户指示的要评价的内容(步骤S174)。

然后，在可以指定要评价的内容(步骤S174/是)的情况下，结束内容检测处理。

注意，在不能指定要评价的内容(步骤S174/否)的情况下，结束响应处理。替选地，如上所述，可以生成用于指定要评价的内容的询问。

(询问话语的生成)

接下来，将参照图6详细描述在步骤S127中示出的询问话语的生成处理。图6是示出根据本实施方式的评价提取处理的流程图。

如图6所示，首先，话语生成单元207获取由评价提取单元205提取的肯定/否定评价(步骤S183)。

接下来，在用户评价是肯定评价(步骤S186/肯定)的情况下，话语生成单元207生成肯定同感的话语和/或关于原因的询问的话语(例如，“好”、“好美。让我知道您喜欢的其他地方。”等)(步骤S189)。

另一方面，在否定评价(步骤S186/否定)的情况下，话语生成单元207生成否定同感的话语和/或关于原因的询问的话语(例如，“它不好”、“它不是有趣的。让我知道您不感兴趣的特征”等)(步骤S192)。

<3-2.代理立场设置处理>

随后，将参照图7描述根据本实施方式的代理立场设置处理。如上所述，根据本实施方式的服务器2可以通过立场设置单元208设置代理立场，并且可以参考代理立场来生成询问话语。

图7是示出根据本实施方式的代理立场设置处理的流程图。如图7所示，首先，服务器2的控制单元20通过评价提取单元205来分析评价词(评价提取)(步骤S203)并且确定用户评价是否与代理的立场匹配(步骤S206)。

接下来，在用户评价与代理的立场不匹配(步骤S206/否)的情况下，控制单元20执行控制，使得话语生成单元207生成用于询问肯定评价/否定评价的原因的话语，并且输出控制单元209使代理装置1通过声音输出话语(步骤S209)。

接下来，控制单元20使话语分析单元203分析用户的响应(步骤S212)并且使立场设置单元208确定代理的立场是否改变(步骤S215)。用于改变立场的条件不受特别限制，但是可以例如根据预设规则来确定。具体地，例如，在用户的评价原因是特定的情况下或者在列出大量评价原因的情况下，可以改变代理立场。此外，在内容是音乐的情况下，可以在用户多次收听音乐的情况下改变代理立场。

接下来，在改变代理立场(步骤S215/是)的情况下，立场设置单元208改变代理立场(更新代理立场DB 25)。此外，控制单元20可以生成响应以向用户通知改变(例如，“这是一首好歌。在听了多次时它成为我的最爱”(从否定立场变为肯定立场)、“我明白了。我也可能讨厌它”(从肯定立场变为否定立场))等，并且输出回应。

另一方面，在用户评价与代理的立场匹配(步骤S206/是)的情况下，控制单元20执行控制，使得话语生成单元207生成用于表示对肯定评价/否定评价的有同感的响应话语，并且输出控制单元209使代理装置1通过声音输出响应话语(步骤S221)。应认识到，控制单元20还可以执行用于询问原因的话语。

<<4.补充>>

以上详细描述了根据本实施方式的信息处理***。以下将补充上述实施方式。

声音代理的询问话语不限于代理装置1通过声音输出的情况，并且例如，可以显示或投影代理的响应句子。

此外，可以在用户观看内容之前执行询问。例如，在用户试图观看悬疑剧(用户状态的识别)的情况下，服务器2从代理装置1输出询问话语“您喜欢悬疑吗？”。

此外，可以结合诸如新闻的其他信息向用户执行询问(例如，“您认为最近的戏剧○○的主题是什么？”等)。

此外，服务器2还可以累积用户的肯定/否定反应(除了话语内容之外，还包括用户的状态，例如姿势、面部表情或视线的移动)，并且在用户没有明确的响应情况下预测肯定/否定评价。在这种情况下，服务器2可以执行用于询问用户预测的评价是否正确的话语(例如，“看起来您非常不喜欢这首歌”等)，以获得更多确定的偏好信息。

此外，由于肯定/否定反应具有个体差异(假设具有高响应的人和具有低响应的人)，服务器2考虑到个体的特点来提取评价。

此外，在与其他用户的评价一致的情况下，服务器2使得降低用户的评价的确定程度(减小权重)。这是因为，在多个用户进行对话的情况下，用户可能与其他用户具有不同的意见但是与其他用户配合一致。此外，可以根据用户是单独的还是与多个用户一起来改变询问的方法和内容。

此外，在可能根据用户的状况获取偏好信息的情况下，进一步继续询问，并且在用户疲倦的情况下减少询问。此外，根据生物信息、话语(话语内容、话语节奏、语音音量等)、时区、星期几等来确定用户的状况(疲倦、忙碌、放松、空闲时间等)。

此外，在获取用户的偏好信息并且实现目的之后，可以继续对话。例如，对话可能是仅表示同感并且敦促下一个话语的话语(例如，“很好，还有别的吗？”等)。

此外，服务器2可以根据内容来控制询问的定时。例如，在内容是广播节目的情况下，可以在商业广告期间执行询问，或者在内容是音乐的情况下，可以在音乐改变时执行对内容的询问。

此外，可以在一个代理装置1中设置多个代理(角色、性格)。可以为每个代理设置立场，并且可以使与用户评价匹配的代理出现。

<<5.结论>>

如上所述，在根据本公开内容的本实施方式的信息处理***中，可以根据用户的话语内容通过更自然的会话来获取用户的偏好信息。

此外，可以通过参与多个用户的对话并且利用自然会话增强会话例如表示与用户评价的同感、敦促相关内容的对话或敦促未进行评价的用户的话语来获取进一步的偏好信息。

此外，在本实施方式中，可考虑话语和兴奋的间隔来控制询问的定时，使得代理可以自然地参与会话而不会干扰用户的会话并且继续会话。与传统的单方面信息呈现不同，可以实现用户与声音代理之间的舒适(无压力)会话(交互)。

尽管已经参照附图详细描述了本公开内容的优选实施方式，但是本技术不限于这些示例。明显的是，具有本公开内容所属的技术领域中的普通知识的人员可以在权利要求书中描述的技术构思的范围内构思出各种变型和修改，并且显然可以理解的是，这些变型和修改属于本公开内容的技术范围。

例如，还可以创建用于使诸如上述代理装置1或服务器2中内置的CPU、ROM或RAM的硬件表现出代理装置1或服务器2的功能的计算机程序。此外，还提供了存储计算机程序的计算机可读存储介质。

此外，本说明书中所描述的效果仅仅是说明性的或示例性的，而并非限制性的。也就是说，根据本公开内容的技术可以从本说明书的描述以及上述效果或代替上述效果表现出对于本领域技术人员而言明显的其他效果。

应认识到，本技术可以采用下述配置。

(1)

一种信息处理设备，其包括：

评价提取单元，其基于用户的与内容有关的话语内容，提取用户对内容的评价；以及

生成单元，其基于所提取的评价来生成用于进一步获取用户对内容的偏好信息的询问声音数据。

(2)

根据上述(1)所述的信息处理设备，其中，评价提取单元从多个用户的对话内容中提取每个用户对所述内容的评价。

(3)

根据上述(1)或(2)所述的信息处理设备，其中，所述生成单元生成作为偏好信息而问询用户的评价的原因的询问声音数据。

(4)

根据上述(1)至(3)中任一项所述的信息处理设备，其中，生成单元生成包括与用户对内容的评价有同感的话语的询问声音数据。

(5)

根据上述(1)至(4)中任一项所述的信息处理设备，其中，评价提取单元从话语内容的分析结果获取与作为评价对象的内容有关的评价词并且提取评价。

(6)

根据上述(1)至(5)中任一项所述的信息处理设备，其中，评价提取单元还基于用户的表情、情绪、视线或姿势中的至少一个来提取用户对内容的评价。

(7)

根据上述(1)至(6)中任一项所述的信息处理设备，其中，在多个用户对所述内容的评价彼此不匹配的情况下，生成单元生成在与肯定评价或否定评价有同感的基础上作为所述偏好信息而询问评价原因的询问声音数据。

(8)

根据上述(1)至(7)中任一项所述的信息处理设备，其中，所述生成单元生成用于向多个用户之中未对内容说出评价的用户询问对内容的评价的询问声音数据。

(9)

根据(1)至(7)中任一项所述的信息处理设备，其中

所述信息处理设备还包括输出控制单元，该输出控制单元执行控制使得通过声音输出所生成的询问数据。

(10)

根据上述(9)所述的信息处理设备，其中，输出控制单元确定多个用户的对话的状况，并且执行控制，使得在预定定时处通过声音输出询问声音数据。

(11)

根据上述(1)至(10)中任一项所述的信息处理设备，其中，评价提取单元根据与所述用户进行对话的其他用户是否同意所述用户的评价来提取所述其他用户的评价。

(12)

根据上述(1)至(11)中任一项所述的信息处理设备，其中，生成单元在代理的设置偏好信息与用户的评价类似的情况下与所述评价有同感，并且在该代理的设置偏好信息与用户的评价不同的情况下生成用于询问所述评价原因的询问声音数据。

(13)

根据上述(1)至(12)中任一项所述的信息处理设备，其中，所述生成单元生成用于询问所存储的用户的偏好信息中的与内容有关的未登记的偏好信息的询问声音数据。

(14)

根据上述(1)至(13)中任一项所述的信息处理设备，其中，所述生成单元根据用户对询问的反应来确定是否继续生成询问声音数据。

(15)

一种信息处理方法，其包括：

由处理器：

基于用户的与内容有关的话语内容，提取所述用户对内容的评价；以及

基于所提取的评价来生成用于进一步获取用户对内容的偏好信息的询问声音数据。

(16)

一种程序，该程序用于使计算机用作：

附图标记列表

1 代理装置

2 服务器

3 显示装置

4 内容DB

5 网络

10 控制单元

11 通信单元

12 声音输入单元

13 摄像装置

14 生物传感器

15 声音输出单元

16 投影仪

17 存储单元

20 控制单元

21 通信单元

22 用户信息DB

23 评价词DB

24 询问话语句子DB

25 代理立场DB

201 声音识别单元

202 用户状态识别单元

203 话语分析单元

204 内容检测单元

205 评价提取单元

206 内容偏好管理单元

207 话语生成单元

208 立场设置单元

209 输出控制单元

Claims

1.一种信息处理设备，包括：

评价提取单元，其基于用户的与内容有关的话语内容，提取所述用户对所述内容的评价；以及

生成单元，其基于所提取的评价来生成用于进一步获取所述用户对所述内容的偏好信息的询问声音数据。

2.根据权利要求1所述的信息处理设备，其中，所述评价提取单元从多个用户的对话内容中提取每个用户对所述内容的评价。

3.根据权利要求1所述的信息处理设备，其中，所述生成单元生成作为所述偏好信息而问询所述用户的评价原因的询问声音数据。

4.根据权利要求1所述的信息处理设备，其中，所述生成单元生成包括与所述用户对所述内容的评价有同感的话语的询问声音数据。

5.根据权利要求1所述的信息处理设备，其中，所述评价提取单元从所述话语内容的分析结果获取与作为评价对象的内容有关的评价词并且提取所述评价。

6.根据权利要求1所述的信息处理设备，其中，所述评价提取单元还基于所述用户的表情、情绪、视线或姿势中的至少一个来提取所述用户对所述内容的所述评价。

7.根据权利要求1所述的信息处理设备，其中，在多个用户对所述内容的评价彼此不匹配的情况下，所述生成单元生成在与肯定评价或否定评价有同感的基础上作为所述偏好信息而询问评价原因的询问声音数据。

8.根据权利要求1所述的信息处理设备，其中，所述生成单元生成用于向多个用户之中未对所述内容说出评价的用户询问对所述内容的评价的询问声音数据。

9.根据权利要求1所述的信息处理设备，其中，

所述信息处理设备还包括输出控制单元，所述输出控制单元执行控制使得通过声音输出所生成的询问数据。

10.根据权利要求9所述的信息处理设备，其中，所述输出控制单元确定多个用户的对话的状况，并且执行控制，使得在预定定时处通过声音输出所述询问声音数据。

11.根据权利要求1所述的信息处理设备，其中，所述评价提取单元根据与所述用户进行对话的其他用户是否同意所述用户的评价来提取所述其他用户的评价。

12.根据权利要求1所述的信息处理设备，其中，所述生成单元在代理的设置偏好信息与所述用户的评价类似的情况下与所述评价有同感，并且在所述代理的设置偏好信息与所述用户的评价不同的情况下生成询问所述评价原因的询问声音数据。

13.根据权利要求1所述的信息处理设备，其中，所述生成单元生成用于询问所存储的所述用户的偏好信息中的与所述内容有关的未登记的偏好信息的询问声音数据。

14.根据权利要求1所述的信息处理设备，其中，所述生成单元根据用户对询问的反应来确定是否继续生成询问声音数据。

15.一种信息处理方法，包括：

由处理器：

基于用户的与内容有关的话语内容，提取所述用户对所述内容的评价；以及

基于所提取的评价来生成用于进一步获取所述用户对所述内容的偏好信息的询问声音数据。

16.一种程序，所述程序用于使计算机用作：