WO2017041370A1

WO2017041370A1 - 基于人工智能的人机聊天方法和装置

Info

Publication number: WO2017041370A1
Application number: PCT/CN2015/096342
Authority: WO
Inventors: 赵世奇; 亓超; 吴华; 忻舟; �田�浩; 周湘阳; 陈洪亮; 温泉; 张晓庆; 许心诺; 严睿
Original assignee: 百度在线网络技术（北京）有限公司
Priority date: 2015-09-07
Filing date: 2015-12-03
Publication date: 2017-03-16
Also published as: CN105183848A

Abstract

一种基于人工智能的人机聊天方法和装置，其中，方法包括以下步骤：接收用户输入的输入信息（S1）；将输入信息分发至聊天服务模块（S2）；接收多个聊天服务模块返回的候选回复（S3）；基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息（S4）。基于人工智能的人机聊天方法和装置，通过接收用户输入的输入信息，并将输入信息分发至聊天服务模块，然后接收多个聊天服务模块返回的候选回复，以及基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息，能够与用户进行多轮聊天，真实自然，具有主动性，还能针对不同用户返回符合用户风格的回复，更加个性化、智能化。

Description

基于人工智能的人机聊天方法和装置

相关申请的交叉引用

本申请要求百度在线网络技术(北京)有限公司于2015年9月7日提交的、发明名称为“基于人工智能的人机聊天方法和装置”的、中国专利申请号“201510564173.0”的优先权。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的人机聊天方法和装置。

背景技术

人工智能(Artificial Intelligence)是计算机科学的一个分支，英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。

人机聊天是指人与计算机之间进行交互聊天的过程。人机聊天可应用于娱乐及情感陪伴、智能服务拟人化等方面。例如：通过人机聊天***可以随时随地进行对话，缓解人们的生活压力，对于儿童还可帮助儿童提高语言能力。

目前，传统的人机聊天***主要基于大规模自动挖掘的聊天句对，每个聊天句对中含有聊天上句P(post)和针对P的下句R(Response)。对于用户输入的聊天句子Q(query)，首先计算出与Q相似度最高的多个聊天上句{P1,P2,…,Pn}，再对聊天上句对应的聊天下句{R1,R2,…,Rn}进行排序，然后选择出最优的聊天下句R返回给用户。

但是，传统的人机聊天***存在以下缺点：缺乏多轮聊天能力，即用户提出聊天上句，机器回复聊天下句，缺乏主动性，不够真实自然；对于时效性要求较高的对话例如新闻，则无法精准地进行回答；另外，聊天内容缺乏个性化，不同用户提出的相同或相似问题，只能回复同样的答案，缺乏个性化及智能化。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明的一个目的在于提出一种基于人工智能的人机聊天方法，能够与用户进行多轮聊天，真实自然，具有主动性，还能针对不同用户返回符合用户风格的回复，更加个性化、智能化。

本发明的第二个目的在于提出一种基于人工智能的人机聊天装置。

为了实现上述目的，本发明第一方面实施例提出了一种基于人工智能的人机聊天方法，包括：接收用户输入的输入信息；将所述输入信息分发至聊天服务模块；接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。

本发明实施例的基于人工智能的人机聊天方法，通过接收用户输入的输入信息，并将输入信息分发至聊天服务模块，然后接收多个聊天服务模块返回的候选回复，以及基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息，能够与用户进行多轮聊天，真实自然，具有主动性，还能针对不同用户返回符合用户风格的回复，更加个性化、智能化。

本发明第二方面实施例提出了一种基于人工智能的人机聊天装置，包括：第一接收模块，用于接收用户输入的输入信息；分发模块，用于将所述输入信息分发至聊天服务模块；第二接收模块，用于接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；提供模块，用于基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。

本发明实施例的基于人工智能的人机聊天装置，通过接收用户输入的输入信息，并将输入信息分发至聊天服务模块，然后接收多个聊天服务模块返回的候选回复，以及基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息，能够与用户进行多轮聊天，真实自然，具有主动性，还能针对不同用户返回符合用户风格的回复，更加个性化、智能化。

本发明实施例第三方面公开了一种存储介质，用于存储应用程序，所述应用程序用于执行本发明第一方面实施例所述的基于人工智能的人机聊天方法。

本发明实施例第四方面公开了一种设备，包括：一个或者多个处理器；存储器；一个或者多个模块，所述一个或者多个模块存储在所述存储器中，当被所述一个或者多个处理器执行时进行如下操作：

接收用户输入的输入信息；

将所述输入信息分发至聊天服务模块；

接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；

基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。

附图说明

本发明所述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明一个实施例的基于人工智能的人机聊天方法的流程图。

图2是根据本发明一个实施例的话题聊天图谱的效果示意图。

图3是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图一。

图4是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图二。

图5是根据本发明一个实施例的基于搜索的聊天模块的结构示意图。

图6是根据本发明一个实施例的富知识聊天模块的结构示意图。

图7是根据本发明一个实施例的基于画像的聊天模块的结构示意图一。

图8是根据本发明一个实施例的基于画像的聊天模块的结构示意图二。

图9是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图三。

图10是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图四。

图11是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图五。

图12是根据本发明一个实施例的基于人工智能的人机聊天装置的结构示意图六。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于人工智能的人机聊天方法和装置。

如图1所示，基于人工智能的人机聊天方法可包括：

S1、接收用户输入的输入信息。

其中，输入信息可以是语音信息，也可以是文本信息。

在接收用户输入的输入信息之后，可对输入信息进行纠错和/或改写，用于纠正输入信息中的错别字，改写不规则的口语化表达等。

另外，还可获取与用户聊天的上文信息，然后根据上文信息判断输入信息与上文信息的依赖关系是否大于预设关系阈值。如果大于预设关系阈值，则可根据上文信息对输入信息进行补全，从而保证人机聊天的流畅度。具体地，对输入信息进行补全可包括指代消解。举例来说，输入信息为“他结婚了么？”，则可根据上文信息“刘德华”将输入信息中的“他”替代为“刘德华”。对输入信息进行补全还可包括省略补全。举例来说，上文信息“刘德华老婆叫朱丽倩。”，输入信息为“我不认识。”，则可将输入信息补全为“我不认识朱丽倩。”。

此外，还可根据上文信息获取用户当前的话题信息，以便后续聊天服务模块对聊天话题进行引导。

S2、将输入信息分发至聊天服务模块。

具体地，可对输入信息进行领域分析以获取输入信息对应的领域。然后，可根据输入信息对应的领域将输入信息分发至具有相同或相近似领域的聊天服务模块。

其中，聊天服务模块可包括基于搜索的聊天模块、富知识聊天模块、基于画像的聊天模块和基于众包的聊天模块中的一种或多种。

具体地，基于搜索的聊天模块可对输入信息进行切词以生成多个聊天短句，然后可根据多个聊天短句查询聊天语料库从而生成多个聊天语料上句和多个聊天语料上句对应的多个聊天语料下句。其中，聊天语料库为预先建立，语聊来源可包括但不限于贴吧等论坛数据中的“发帖-回帖”、微博中的“博文-回复”、问答社区中的“问题-答案”等。

在此之后，可对多个聊天语料上句进行过滤。具体地，可计算输入信息与多个聊天语料上句之间的相似度。如果相似度小于第一预设相似度阈值，则可将对应的聊天语料上句过滤；如果相似度大于或等于第一预设相似度阈值，则可将对应的聊天语料上句保留。

在对聊天语料上句进行过滤之后，可对过滤之后的聊天语料上句对应的聊天语料下句进行分类。具体地，计算输入信息与多个聊天语料下句之间的相似度，并根据相似度基于GBDT(梯度升压决策树，Gradient Boost Decision Tree)、SVM(支持向量机，Support Vector Machine)等机器学习模型对多个聊天语料下句进行分类。其中，输入信息与多个聊天语料下句之间的相似度可以是输入信息与聊天语料下句之间字面的相似度，也可以是输入信息与聊天语料下句基于深度神经网络训练得到的相似度，也可以是输入信息与聊天语料下句基于机器翻译模型训练得到的相似度。应当理解的是，本实施例中输入信息与多个聊天语料下句之间的相似度以及GBDT、SVM等机器学习模型为公知技术，此处不赘述。

然后基于搜索的聊天模块可对分类之后的聊天语料下句进行重排序，并根据排序结果生成候选回复。具体地，可根据用户聊天的上文信息获取用户的聊天属性，再根据聊天属性对分类之后的聊天语料下句基于学习排序模型(Learning-To-Rank)进行重排序。其中，聊天属性可包括聊天的场合如时间地点等、聊天的趣味性、聊天的风格等。当然，聊天属性不仅限于从用户聊天的上文信息中获取，也可以根据用户长期的历史聊天记录获取。应当理解的是，本实施例中学习排序模型为公知技术，此处不赘述。

富知识聊天模块可根据输入信息生成搜索词，并根据搜索词进行搜索以生成多个搜索结果，然后对多个搜索结果进行句子抽取，以获取与搜索词的相似度大于第二预设相似度阈值的句子的候选句子集合。在此之后，可对候选句子集合中的句子进行改写以生成候选回复。此外，还可根据用户的聊天属性对候选句子集合中的句子进行重排序。举例来说，输入信息为“希望有机会能到富士山旅游”，可对输入信息进行解析并生成对应的搜索词 “富士山、旅游”，然后根据搜索词获得多个搜索结果，并抽取与搜索词相似度高的句子。其中，有的句子可能包括如“记者了解到”等明显节选自网页文本，因此需要对这些句子进行改写，使其更加流畅，更像自然语言聊天的句子，最终生成的候选回复为“富士山由于天气原因，一年中只有规定的夏季的一段时间可以登山”，相对于传统的回复“我也想去富士山，一起吧。”，具有一定的知识性，且具有一定时效性，可使用户能在聊天过程中获取有用的知识。

为了更好地实现拟人化，以及为用户提供个性化服务，人机聊天***可设定自身的属性、状态、兴趣等，即***画像模型。还可设定用户的属性、状态、兴趣等，即用户画像模型。当然，在面对不同的用户时，使用的***画像模型可以是同一个，也可以针对每个用户均可设置与之对应的***画像模型。***画像模型和用户画像模型均基于画像知识图谱。画像知识图谱是一个层次化的知识体系。举例来说，“家庭成员”节点可包括“兄弟姐妹”和“父母”两个子节点，“父母”子节点包括“父亲”和“母亲”两个子节点。每个节点均对应有多个输入信息模板簇，例如“你父亲是谁”、“谁是你父亲”、“你的父亲叫什么”属于同一个输入信息模板簇。每个输入信息模板簇对应一个或多个候选回复。输入信息模板簇和候选回复可包含变量，例如兴趣、爱好、嗜好对应同一属性“INTEREST”，而“INTEREST”的属性值可包括爬山、音乐、读书、运动等。

具体地，基于画像的聊天模块可获取用户的聊天语境，并根据聊天语境判断是否满足收集条件。如果判断满足收集条件，则可向用户发送问题。在此之后，可接收用户根据问题的回答信息，并根据回答信息对用户画像模型进行更新。例如：在与用户聊电影相关的话题时，可向用户发送问题“你喜欢什么电影？”或者用户问人机聊天***“你喜欢吃什么？”，人机聊天***可反问用户“你喜欢吃什么？”，在用户回答后，可基于用户的回答信息对用户画像模型进行更新，更加符合用户个性化的需求。

此外，基于画像的聊天模块还可获取用户的聊天内容，并根据聊天内容提取用户画像数据，然后根据提取的用户画像数据对用户画像模型进行更新。例如：用户在聊天过程中说道“我没事的时候喜欢爬爬山、钓钓鱼。”，可提取用户画像数据“爱好爬山、爱好钓鱼”，从而对用户画像模型进行更新。同时，可基于用户画像数据抽取合适的答案，向用户返回合适的回答信息。

众包(crowdsourcing)是一种将特定任务外包给互联网中非特定用户的方法，对于人机聊天中，机器难以回答的问题，可分发给执行者在线地实时地进行人工回复，从而满足用户的实际需求。

具体地，基于众包的聊天模块可判断输入信息是否适合众包完成，例如用户情绪低落需要安慰等，则适合众包完成。例如用户的输入信息中包含有个人身份信息、密码、电话等隐私信息，则不适合众包完成。

如果判断适合众包完成，则可将输入信息分发至对应的执行者。当然，同时也可将上文信息一同发送给执行者，执行者可根据上文信息和输入信息进行回复。然后基于众包的聊天模块可接收执行者的回复信息，并对回复信息进行质量判断。如果满足质量要求，则将回复信息作为候选回复。例如：回复信息中如果包含低俗、反动、色情内容，则质量不过关。或者执行者回复的时间超过了预定时长，则该执行者的回复信息将不被采用，同时可将该回复信息保存至聊天语料库中。

在此之外，还可判断输入信息是否属于无实际内容的聊天信息，如“呵呵”、“hoho”等。如果判断是属于无实际内容的聊天信息，则可获取当前话题，即基于话题模型(Topic Model)根据历史聊天记录计算出当前话题。在获取当前话题之后，可基于话题聊天图谱根据当前话题生成引导话题。其中，话题聊天图谱是一个以话题为节点的有向图。例如，如图2所示，节点“休闲”可指向节点“看电影”和节点“听歌”，则说明可从话题“休闲”引导至话题“看电影”或者话题“听歌”。话题“看电影”和话题“听歌”均具有一定的引导概率，可根据引导概率实现话题的引导，从而保证引导话题的多样性。

然后，可根据引导话题生成候选回复。具体地，可基于自然语言生成模型(Natural Language Generation)，生成候选回复的模板，将引导话题填充至该模板中生成候选回复；也可以选取包含引导话题的句子作为候选回复，从而实现对用户进行主动地聊天话题引导。

S3、接收多个聊天服务模块返回的候选回复。

其中，候选回复具有对应的置信度。

S4、基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息。

具体地，可获取用户的输入信息的特征，并基于输入信息的特征和置信度对待选回复进行排序。其中，输入信息的特征可包括分类特征、字面特征、话题特征等。置信度越高，则待选回复质量越好，可按照置信度从高到低的顺序对待选回复进行排序，最终向用户提供符合用户需求的聊天信息。

另外，还可通过增强学习模型(Reinforcement Learning)根据用户的反馈信息进行更新，从而能够为用户提供更满意的聊天信息。例如：在回复用户的聊天信息中添加评论按钮如“赞”或“踩”以收集用户的反馈信息；或者基于情感分析技术，对用户在聊天中的输入信息进行分析，从而获得用户的评价，例如：“你真智能”等；或者通过记录与用户聊天的交互次数，判断用户的满意度。

为实现上述目的，本发明还提出一种基于人工智能的人机聊天装置。

如图3所示，该基于人工智能的人机聊天装置可包括：第一接收模块1000、分发模块2000、聊天服务模块3000、第二接收模块4000和提供模块5000。

第一接收模块1000用于接收用户输入的输入信息。

其中，输入信息可以是语音信息，也可以是文本信息。

分发模块2000用于将输入信息分发至聊天服务模块3000。

第二接收模块4000用于接收多个聊天服务模块3000返回的候选回复。其中，候选回复具有对应的置信度。

提供模块5000用于基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息。

具体地，提供模块5000可获取用户的输入信息的特征，并基于输入信息的特征和置信度对待选回复进行排序。其中，输入信息的特征可包括分类特征、字面特征、话题特征等。置信度越高，则待选回复质量越好，可按照置信度从高到低的顺序对待选回复进行排序，最终向用户提供符合用户需求的聊天信息。

如图4所示，聊天服务模块3000可包括基于搜索的聊天模块3100、富知识聊天模块3200、基于画像的聊天模块3300和基于众包的聊天模块3400。

其中，如图5所示，基于搜索的聊天模块3100可包括切词子模块3110、生成子模块3120、过滤子模块3130、分类子模块3140和排序子模块3150。其中，过滤子模块3130可包括计算单元3131、过滤单元3132、保留单元3133，分类子模块3140可包括计算单元3141、分类单元3142，排序子模块3150可包括获取单元3151和排序单元3152。

具体地，切词子模块3110可对输入信息进行切词以生成多个聊天短句，然后生成子模块3120可根据多个聊天短句查询聊天语料库从而生成多个聊天语料上句和多个聊天语料上句对应的多个聊天语料下句。其中，聊天语料库为预先建立，语聊来源可包括但不限于贴吧等论坛数据中的“发帖-回帖”、微博中的“博文-回复”、问答社区中的“问题-答案”等。

在此之后，过滤子模块3130可对多个聊天语料上句进行过滤。具体地，计算单元3131可计算输入信息与多个聊天语料上句之间的相似度。如果相似度小于第一预设相似度阈值，则过滤单元3132可将对应的聊天语料上句过滤；如果相似度大于或等于第一预设相似度阈值，则保留单元3133可将对应的聊天语料上句保留。

在对聊天语料上句进行过滤之后，分类子模块3140可对过滤之后的聊天语料上句对应的聊天语料下句进行分类。具体地，计算单元3141可计算输入信息与多个聊天语料下句之间的相似度，分类单元3142根据相似度基于GBDT(梯度升压决策树，Gradient Boost Decision Tree)、SVM(支持向量机，Support Vector Machine)等机器学习模型对多个聊天语料下句进行分类。其中，输入信息与多个聊天语料下句之间的相似度可以是输入信息与聊天语料下句之间字面的相似度，也可以是输入信息与聊天语料下句基于深度神经网络训练得到的相似度，也可以是输入信息与聊天语料下句基于机器翻译模型训练得到的相似度。应当理解的是，本实施例中输入信息与多个聊天语料下句之间的相似度以及GBDT、SVM等机器学习模型为公知技术，此处不赘述。

然后排序子模块3150可对分类之后的聊天语料下句进行重排序，并根据排序结果生成候选回复。具体地，获取单元3151可根据用户聊天的上文信息获取用户的聊天属性，排序单元3152根据聊天属性对分类之后的聊天语料下句基于学习排序模型(Learning-To-Rank)进行重排序。其中，聊天属性可包括聊天的场合如时间地点等、聊天的趣味性、聊天的风格等。当然，聊天属性不仅限于从用户聊天的上文信息中获取，也可以根据用户长期的历史聊天记录获取。应当理解的是，本实施例中学习排序模型为公知技术，此处不赘述。

如图6所示，富知识聊天模块3200可包括生成子模块3210、抽取子模块3220、改写子模块3230和重排序子模块3240。具体地，生成子模块3210可根据输入信息生成搜索词，并根据搜索词进行搜索以生成多个搜索结果，然后抽取子模块3220对多个搜索结果进行句子抽取，以获取与搜索词的相似度大于第二预设相似度阈值的句子的候选句子集合。在此之后，改写子模块3230可对候选句子集合中的句子进行改写以生成候选回复。此外，重排序子模块3240可根据用户的聊天属性对候选句子集合中的句子进行重排序。举例来说，输入信息为“希望有机会能到富士山旅游”，可对输入信息进行解析并生成对应的搜索词“富士山、旅游”，然后根据搜索词获得多个搜索结果，并抽取与搜索词相似度高的句子。其中，有的句子可能包括如“记者了解到”等明显节选自网页文本，因此需要对这些句子进行改写，使其更加流畅，更像自然语言聊天的句子，最终生成的候选回复为“富士山由于天气原因，一年中只有规定的夏季的一段时间可以登山”，相对于传统的回复“我也想去富士山，一起吧。”，具有一定的知识性，且具有一定时效性，可使用户能在聊天过程中获取有用的知识。

如图7所示，基于画像的聊天模块3300可包括第一获取子模块3310、判断子模块3320、发送子模块3330、第一更新子模块3340。

具体地，第一获取子模块3310可获取用户的聊天语境，判断子模块3320根据聊天语境判断是否满足收集条件。如果判断满足收集条件，则发送子模块3330可向用户发送问题。在此之后，第一更新子模块3340可接收用户根据问题的回答信息，并根据回答信息对用户画像模型进行更新。例如：在与用户聊电影相关的话题时，可向用户发送问题“你喜欢什么电影？”或者用户问人机聊天***“你喜欢吃什么？”，人机聊天***可反问用户“你喜欢吃什么？”，在用户回答后，可基于用户的回答信息对用户画像模型进行更新，更加符合用户个性化的需求。

此外，如图8所示，基于画像的聊天模块3300还可包括第二获取子模块3350、提取子模块3360、第二更新子模块3370。

具体地，第二获取子模块3350可获取用户的聊天内容，提取子模块3360根据聊天内容提取用户画像数据，然后第二更新子模块3370根据提取的用户画像数据对用户画像模型进行更新。例如：用户在聊天过程中说道“我没事的时候喜欢爬爬山、钓钓鱼。”，可提取用户画像数据“爱好爬山、爱好钓鱼”，从而对用户画像模型进行更新。同时，可基于用户画像数据抽取合适的答案，向用户返回合适的回答信息。

具体地，基于众包的聊天模块3400可判断输入信息是否适合众包完成，例如用户情绪低落需要安慰等，则适合众包完成。例如用户的输入信息中包含有个人身份信息、密码、电话等隐私信息，则不适合众包完成。

如果判断适合众包完成，则基于众包的聊天模块3400可将输入信息分发至对应的执行者。当然，同时也可将上文信息一同发送给执行者，执行者可根据上文信息和输入信息进行回复。然后基于众包的聊天模块可接收执行者的回复信息，并对回复信息进行质量判断。如果满足质量要求，则将回复信息作为候选回复。例如：回复信息中如果包含低俗、反动、色情内容，则质量不过关。或者执行者回复的时间超过了预定时长，则该执行者的回复信息将不被采用，同时可将该回复信息保存至聊天语料库中。

另外，如图9所示，该基于人工智能的人机聊天装置还可包括纠错模块6000。

纠错模块6000用于在接收用户输入的输入信息之后，对输入信息进行纠错和/或改写，用于纠正输入信息中的错别字，改写不规则的口语化表达等。

另外，如图10所示，该基于人工智能的人机聊天装置还可包括分析模块7000。

分析模块7000用于在接收用户输入的输入信息之后，对输入信息进行领域分析以获取输入信息对应的领域，然后分发模块2000可根据输入信息对应的领域将输入信息分发至具有相同或相近似领域的聊天服务模块。

另外，如图11所示，该基于人工智能的人机聊天装置还可包括第一获取模块8000、第一判断模块9000、补全模块10000。

第一获取模块8000用于在接收用户输入的输入信息之后，获取与用户聊天的上文信息，并根据上文信息获取用户当前的话题信息。然后，第一判断模块9000可根据上文信息判断输入信息与上文信息的依赖关系是否大于预设关系阈值。在依赖关系大于预设关系阈值时，补全模块10000可根据上文信息对输入信息进行补全，从而保证人机聊天的流畅度。具体地，对输入信息进行补全可包括指代消解。举例来说，输入信息为“他结婚了么？”，则可根据上文信息“刘德华”将输入信息中的“他”替代为“刘德华”。对输入信息进行补全还可包括省略补全。举例来说，上文信息“刘德华老婆叫朱丽倩。”，输入信息为“我不认识。”，则可将输入信息补全为“我不认识朱丽倩。”。

此外，如图12所示，该基于人工智能的人机聊天装置还可包括第二判断模块11000、第二获取模块12000、第一生成模块13000和第二生成模块14000。

第二判断模块11000用于判断输入信息是否属于无实际内容的聊天信息，如“呵呵”、“hoho”等。如果判断是属于无实际内容的聊天信息，则第二获取模块12000可获取当前话题，即基于话题模型(Topic Model)根据历史聊天记录计算出当前话题。在获取当前话题之后，第一生成模块13000可基于话题聊天图谱根据当前话题生成引导话题。其中，话题聊天图谱是一个以话题为节点的有向图。例如，如图2所示，节点“休闲”可指向节点“看电影”和节点“听歌”，则说明可从话题“休闲”引导至话题“看电影”或者话题“听歌”。话题“看电影”和话题“听歌”均具有一定的引导概率，可根据引导概率实现话题的引导，从而保证引导话题的多样性。然后，第二生成模块14000可根据引导话题生成候选回复。具体地，可基于自然语言生成模型(Natural Language Generation)，生成候选回复的模板，将引导话题填充至该模板中生成候选回复；也可以选取包含引导话题的句子作为候选回复，从而实现对用户进行主动地聊天话题引导。

为了实现上述实施例，本发明还提出了一种存储介质，用于存储应用程序，该应用程序用于执行本发明任一个实施例所述的基于人工智能的人机聊天方法。

为了实现上述实施例，本发明还提出了一种设备，包括：一个或者多个处理器；存储器；一个或者多个模块，一个或者多个模块存储在存储器中，当被一个或者多个处理器执行时进行如下操作：

S1’、接收用户输入的输入信息。

S2’、将输入信息分发至聊天服务模块。

S3’、接收多个聊天服务模块返回的候选回复。

S4’、基于置信度对待选回复进行排序，并根据排序结果生成聊天信息，并向用户提供聊天信息。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种基于人工智能的人机聊天方法，其特征在于，包括以下步骤：

接收用户输入的输入信息；

将所述输入信息分发至聊天服务模块；

接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；

基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。
如权利要求1所述的方法，其特征在于，在所述接收用户输入的输入信息之后，还包括：

对所述输入信息进行纠错和/或改写。
如权利要求1所述的方法，其特征在于，在所述接收用户输入的输入信息之后，还包括：

对所述输入信息进行领域分析以获取所述输入信息对应的领域，其中，根据所述输入信息对应的领域将所述输入信息分发至具有相同或相近似领域的聊天服务模块。
如权利要求1所述的方法，其特征在于，在所述接收用户输入的输入信息之后，还包括：

获取与所述用户聊天的上文信息；

根据所述上文信息判断所述输入信息与所述上文信息的依赖关系是否大于预设关系阈值；以及

如果大于所述预设关系阈值，则根据所述上文信息对所述输入信息进行补全。
如权利要求4所述的方法，其特征在于，还包括：

根据所述上文信息获取所述用户当前的话题信息。
如权利要求1所述的方法，其特征在于，所述聊天服务模块包括基于搜索的聊天模块、富知识聊天模块、基于画像的聊天模块和基于众包的聊天模块中的一种或多种。
如权利要求6所述的方法，其特征在于，还包括：

所述基于搜索的聊天模块对所述输入信息进行切词以生成多个聊天短句；

所述基于搜索的聊天模块根据所述多个聊天短句查询聊天语料库以生成多个聊天语料上句，以及所述多个聊天语料上句对应的多个聊天语料下句；

所述基于搜索的聊天模块对所述多个聊天语料上句进行过滤；

所述基于搜索的聊天模块对过滤之后的聊天语料上句对应的聊天语料下句进行分类；以及

所述基于搜索的聊天模块对分类之后的所述聊天语料下句进行重排序，并根据排序结果生成所述候选回复。
如权利要求7所述的方法，其特征在于，所述基于搜索的聊天模块对所述多个聊天语料上句进行过滤具体包括：

计算所述输入信息与所述多个聊天语料上句之间的相似度；

如果所述相似度小于第一预设相似度阈值，则将对应的聊天语料上句过滤；以及

如果所述相似度大于或等于所述第一预设相似度阈值，则将对应的聊天语料上句保留。
如权利要求7所述的方法，其特征在于，所述对过滤之后的聊天语料上句对应的聊天语料下句进行分类具体包括：

计算所述输入信息与所述多个聊天语料下句之间的相似度；以及

根据所述相似度对所述多个聊天语料下句进行分类。
如权利要求9所述的方法，其特征在于，所述输入信息与所述多个聊天语料下句之间的相似度包括：

所述输入信息与所述聊天语料下句之间字面的相似度；

或者，所述输入信息与所述聊天语料下句基于深度神经网络训练得到的相似度；

或者，所述输入信息与所述聊天语料下句基于机器翻译模型训练得到的相似度。
如权利要求7所述的方法，其特征在于，所述对分类之后的所述聊天语料下句进行重排序具体包括：

根据所述用户聊天的上文信息获取所述用户的聊天属性；

根据所述聊天属性对所述分类之后的所述聊天语料下句进行重排序。
如权利要求6所述的方法，其特征在于，还包括：

所述富知识聊天模块根据所述输入信息生成搜索词，并根据所述搜索词进行搜索以生成多个搜索结果；

所述富知识聊天模块对所述多个搜索结果进行句子抽取，以获取候选句子集合；

所述富知识聊天模块对所述候选句子集合中的句子进行改写以生成所述候选回复。
如权利要求12所述的方法，其特征在于，其中，所述候选句子集合中的句子与所述搜索词的相似度大于第二预设相似度阈值。
如权利要求12所述的方法，其特征在于，还包括：

根据所述用户的聊天属性对所述候选句子集合中的句子进行重排序。
如权利要求6所述的方法，其特征在于，还包括：

所述基于画像的聊天模块获取所述用户的聊天语境；

所述基于画像的聊天模块根据所述聊天语境判断是否满足收集条件；

如果判断满足所述收集条件，则向所述用户发送问题；

接收所述用户根据所述问题的回答信息，并根据所述回答信息对用户画像模型进行更新。
如权利要求6所述的方法，其特征在于，还包括：

所述基于画像的聊天模块获取所述用户的聊天内容；

所述基于画像的聊天模块根据所述聊天内容提取用户画像数据；

所述基于画像的聊天模块根据提取的所述用户画像数据对所述用户画像模型进行更新。
如权利要求6所述的方法，其特征在于，还包括：

所述基于众包的聊天模块判断所述输入信息是否适合众包完成；

如果判断适合众包完成，则将所述输入信息分发至对应的执行者；

接收所述执行者的回复信息，并对所述回复信息进行质量判断；

如果满足质量要求，则将所述回复信息作为所述候选回复。
如权利要求1所述的方法，其特征在于，还包括：

判断所述输入信息是否属于无实际内容的聊天信息；

如果判断是属于无实际内容的聊天信息，则获取当前话题；

根据所述当前话题生成引导话题；以及

根据所述引导话题生成所述候选回复。
如权利要求1所述的方法，其特征在于，所述基于所述置信度对所述待选回复进行排序具体包括：

获取所述用户的所述输入信息的特征；以及

基于所述输入信息的特征和所述置信度对所述待选回复进行排序。
一种基于人工智能的人机聊天装置，其特征在于，包括：

第一接收模块，用于接收用户输入的输入信息；

分发模块，用于将所述输入信息分发至聊天服务模块；

第二接收模块，用于接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；

提供模块，用于基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。
如权利要求20所述的装置，其特征在于，所述装置还包括：

纠错模块，用于在所述接收用户输入的输入信息之后，对所述输入信息进行纠错和/或改写。
如权利要求20所述的装置，其特征在于，所述装置还包括：

分析模块，用于在所述接收用户输入的输入信息之后，对所述输入信息进行领域分析以获取所述输入信息对应的领域；

所述分发模块，用于根据所述输入信息对应的领域将所述输入信息分发至具有相同或相近似领域的聊天服务模块。
如权利要求20所述的装置，其特征在于，所述装置还包括：

第一获取模块，用于在所述接收用户输入的输入信息之后，获取与所述用户聊天的上文信息；

第一判断模块，用于根据所述上文信息判断所述输入信息与所述上文信息的依赖关系是否大于预设关系阈值；以及

补全模块，用于在所述依赖关系大于所述预设关系阈值时，根据所述上文信息对所述输入信息进行补全。
如权利要求23所述的装置，其特征在于，所述第一获取模块还用于：

根据所述上文信息获取所述用户当前的话题信息。
如权利要求20所述的装置，其特征在于，所述聊天服务模块包括基于搜索的聊天模块、富知识聊天模块、基于画像的聊天模块和基于众包的聊天模块中的一种或多种。
如权利要求25所述的方法，其特征在于，所述基于搜索的聊天模块，具体包括：

切词子模块，用于对所述输入信息进行切词以生成多个聊天短句；

生成子模块，用于根据所述多个聊天短句查询聊天语料库以生成多个聊天语料上句，以及所述多个聊天语料上句对应的多个聊天语料下句；

过滤子模块，用于对所述多个聊天语料上句进行过滤；

分类子模块，用于对过滤之后的聊天语料上句对应的聊天语料下句进行分类；以及

排序子模块，用于对分类之后的所述聊天语料下句进行重排序，并根据排序结果生成所述候选回复。
如权利要求26所述的装置，其特征在于，所述过滤子模块，具体包括：

计算单元，用于计算所述输入信息与所述多个聊天语料上句之间的相似度；

过滤单元，用于如果所述相似度小于第一预设相似度阈值，则将对应的聊天语料上句过滤；以及

保留单元，用于如果所述相似度大于或等于所述第一预设相似度阈值，则将对应的聊天语料上句保留。
如权利要求26所述的装置，其特征在于，所述分类子模块具体包括：

计算单元，用于计算所述输入信息与所述多个聊天语料下句之间的相似度；以及

分类单元，用于根据所述相似度对所述多个聊天语料下句进行分类。
如权利要求28所述的装置，其特征在于，所述输入信息与所述多个聊天语料下句之间的相似度包括：

所述输入信息与所述聊天语料下句之间字面的相似度；

或者，所述输入信息与所述聊天语料下句基于深度神经网络训练得到的相似度；

或者，所述输入信息与所述聊天语料下句基于机器翻译模型训练得到的相似度。
如权利要求26所述的装置，其特征在于，所述排序子模块具体包括：

获取单元，用于根据所述用户聊天的上文信息获取所述用户的聊天属性；

排序单元，用于根据所述聊天属性对所述分类之后的所述聊天语料下句进行重排序。
如权利要求25所述的装置，其特征在于，所述富知识聊天模块，具体包括：

生成子模块，用于根据所述输入信息生成搜索词，并根据所述搜索词进行搜索以生成多个搜索结果；

抽取子模块，用于对所述多个搜索结果进行句子抽取，以候选句子集合；

改写子模块，用于对所述候选句子集合中的句子进行改写以生成所述候选回复。
如权利要求31所述的装置，其特征在于，其中，所述候选句子集合中的句子与所述搜索词的相似度大于第二预设相似度阈值。
如权利要求31所述的装置，其特征在于，还包括：

重排序子模块，用于根据所述用户的聊天属性对所述候选句子集合中的句子进行重排序。
如权利要求25所述的装置，其特征在于，所述基于画像的聊天模块具体包括：

第一获取子模块，用于获取所述用户的聊天语境；

判断子模块，用于根据所述聊天语境判断是否满足收集条件；

发送子模块，用于当满足所述收集条件时，向所述用户发送问题；

第一更新子模块，用于接收所述用户根据所述问题的回答信息，并根据所述回答信息对用户画像模型进行更新。
如权利要求25所述的装置，其特征在于，所述基于画像的聊天模块具体包括：

第二获取子模块，用于获取所述用户的聊天内容；

提取子模块，用于根据所述聊天内容提取用户画像数据；

第二更新子模块，用于根据提取的所述用户画像数据对所述用户画像模型进行更新。
如权利要求25所述的装置，其特征在于，所述基于众包的聊天模块具体用于：

判断所述输入信息是否适合众包完成，如果判断适合众包完成，则将所述输入信息分发至对应的执行者，以及接收所述执行者的回复信息，并对所述回复信息进行质量判断，如果满足质量要求，则将所述回复信息作为所述候选回复。
如权利要求20所述的装置，其特征在于，还包括：

第二判断模块，用于判断所述输入信息是否属于无实际内容的聊天信息；

第二获取模块，用于如果判断是属于无实际内容的聊天信息，则获取当前话题；

第一生成模块，用于根据所述当前话题生成引导话题；以及

第二生成模块，用于根据所述引导话题生成所述候选回复。
如权利要求20所述的装置，其特征在于，所述提供模块具体用于：

获取所述用户的所述输入信息的特征，并基于所述输入信息的特征和所述置信度对所述待选回复进行排序。
一种存储介质，其特征在于，用于存储应用程序，所述应用程序用于执行权利要求1至19中任一项所述的基于人工智能的人机聊天方法。
一种设备，其特征在于，包括：

一个或者多个处理器；

存储器；

一个或者多个模块，所述一个或者多个模块存储在所述存储器中，当被所述一个或者多个处理器执行时进行如下操作：

接收用户输入的输入信息；

将所述输入信息分发至聊天服务模块；

接收所述多个聊天服务模块返回的候选回复，其中，所述候选回复具有对应的置信度；

基于所述置信度对所述待选回复进行排序，并根据排序结果生成聊天信息，并向所述用户提供所述聊天信息。