CN106469212B - 基于人工智能的人机交互方法和装置 - Google Patents

基于人工智能的人机交互方法和装置 Download PDF

Info

Publication number
CN106469212B
CN106469212B CN201610803645.8A CN201610803645A CN106469212B CN 106469212 B CN106469212 B CN 106469212B CN 201610803645 A CN201610803645 A CN 201610803645A CN 106469212 B CN106469212 B CN 106469212B
Authority
CN
China
Prior art keywords
keyword
model
answer
mapping relations
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610803645.8A
Other languages
English (en)
Other versions
CN106469212A (zh
Inventor
�田�浩
赵世奇
忻舟
温泉
马文涛
许腾
许心诺
张海松
周湘阳
严睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610803645.8A priority Critical patent/CN106469212B/zh
Priority to US16/317,526 priority patent/US11645547B2/en
Priority to EP17844812.2A priority patent/EP3508991A4/en
Priority to PCT/CN2017/072267 priority patent/WO2018040501A1/zh
Priority to JP2019501993A priority patent/JP6726800B2/ja
Priority to KR1020197004771A priority patent/KR102170563B1/ko
Publication of CN106469212A publication Critical patent/CN106469212A/zh
Application granted granted Critical
Publication of CN106469212B publication Critical patent/CN106469212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请提出一种基于人工智能的人机交互方法和装置,该基于人工智能的人机交互方法包括:接收用户输入的问题;根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;将所述回答反馈给用户。该方法能够使得人机交互具有真正的人类之间对话交互的效果。

Description

基于人工智能的人机交互方法和装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的人机交互方法和装置。
背景技术
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括智能点餐机器人、语言识别、图像识别、自然语言处理和专家***等。
随着人工智能等技术的发展,人机交互***已经以多种形式出现在人们的生活中。比如在自然对话领域,机器可以与人进行对话,在智能客服领域,客服***可以为人提供服务。但是,目前的人机交互***的流程通常是机器接收到人的问题(query)后,在数据库查找相关的回答(reply)展现给用户。这种方式在本质上是检索,不具有人类之间对话时的逻辑,无法实现真正的人类之间对话交互的效果。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种基于人工智能的人机交互方法,该方法可以使得机器以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。
本申请的另一个目的在于提出一种基于人工智能的人机交互装置。
为达到上述目的,本申请第一方面实施例提出的基于人工智能的人机交互方法,包括:接收用户输入的问题;根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;将所述回答反馈给用户。
本申请第一方面实施例提出的基于人工智能的人机交互方法,通过预先生成的模型得到与用户输入的问题对应的回答,该模型是根据人类对话语料生成的,该回答具有人类对话风格,因此,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。
为达到上述目的,本申请第二方面实施例提出的基于人工智能的人机交互装置,包括:接收模块,用于接收用户输入的问题;获取模块,用于根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;反馈模块,用于将所述回答反馈给用户。
本申请第二方面实施例提出的基于人工智能的人机交互装置,通过预先生成的模型得到与用户输入的问题对应的回答,该模型是根据人类对话语料生成的,该回答具有人类对话风格,因此,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提出的基于人工智能的人机交互方法的流程示意图;
图2是本申请实施例中在训练过程中生成模型的流程示意图;
图3是本申请实施例中语料源的分类示意图;
图4是本申请实施例中一种预测模型的示意图;
图5是本申请实施例中另一种预测模型的示意图;
图6是本申请实施例中另一种预测模型的示意图;
图7是本申请实施例对应的一种总体架构图;
图8是本申请另一个实施例提出的基于人工智能的人机交互方法的流程示意图;
图9是本申请一个实施例提出的基于人工智能的人机交互装置的结构示意图;
图10是本申请另一个实施例提出的基于人工智能的人机交互装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一个实施例提出的基于人工智能的人机交互方法的流程示意图。
如图1所示,本实施例包括:
S11:接收用户输入的问题(query)。
其中,用户可以以文本、语音或图片等形式输入问题。当问题不是文本形式时,可以先对非文本形式的问题进行转换,将其转换为文本。具体采用的技术例如包括语音识别、图片内容识别等转换技术,这些转换技术可以采用已有或将来出现的技术实现,在此不再详细说明。
S12:根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的。
其中,可以在训练阶段生成上述的模型。在训练阶段,先收集大量的人类对话语料,人类对话语料以组(pair)为单位,每组包括问题(query)和回答(answer),在训练时,以语料中的query作为输入,训练模型,使得输出尽量与语料中对应的answer一致。由于该模型是根据人类对话语料生成的,因此根据该模型对当前的问题进行处理后,得到的输出也是具有人类对话风格的answer。
进一步的,上述的模型在具体实现时不限于一个,可以是多个,分别完成不同的功能,以由用户输入的问题获取具有人类对话风格的回答。
S13:将所述回答反馈给用户。
在获取到回答后,可以将回答以语音形式播放给用户。
另外,如果获取的回答是文本形式,则可以通过语音合成等技术将其转换为语音。
本实施例中,通过预先生成的模型得到与用户输入的问题对应的回答,该模型是根据人类对话语料生成的,该回答具有人类对话风格,因此,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。
上一实施例描述了对话过程,在对话过程中会用到模型,该模型可以是在训练过程中生成的,下面对训练过程中生成模型的流程进行描述。
图2是本申请实施例中在训练过程中生成模型的流程示意图。
本实施例中,以模型包括:映射关系、预测模型和语法模型为例。其中,映射关系用于表明问题中的关键词与回答中的关键词之间的映射关系,预测模型用于根据上下文信息在多种映射关系中确定出最优的一种映射关系,以及生成与确定出的映射关系中的关键词匹配的搭配词,语法模型用于调整词条顺序,根据调整后的词条生成符合语法结构的句子。
如图2所示,本实施例包括:
S21:收集人类对话语料。
语料的选择可以基于所有带有人与人对话的地方,包含视频(电影、电视剧、动画等)中的对话、文学作品(历史名著、推理小说、言情小说、网络小说等)中的对话、社交平台(微博、贴吧、豆瓣等)中的对话、地方语言(东北话、北京话、广东话等)对话。
如图3所示,给出了语料源的分类,从而可以从多种语料源中收集到不同风格的语料,并且同一种语料源可以带有一种或多种对话风格。视频中的对话随视频种类的变化对话风格差异很大,喜剧片中的对话一般幽默诙谐、爱情片中的对话一般情深意浓、战争片中的对话一般紧张激烈等;文学作品中的对话风格也随种类不同而不同,历史名著中的对话一般带有某种历史背景的特色、推理小说对话逻辑严密、言情小说对话情感丰富等;网络社交平台中的对话带有很多网络词汇,但是因为其本身就是人们的日常对话整体风格最贴近人们的日常对话;地方语言对话包含各种地方方言,带有各种地方特色。
S22:提取人类对话语料中问题中的关键词及对应的回答中的关键词,根据提取的关键词生成问题中的关键词与回答中的关键词之间的映射关系。
其中,对应一组人类对话语料,可以对其中的问题(简称为问)和回答(简称为答)进行切词,得到问中的词条(term)和答中的词条,再在词条中确定出关键词(如根据出现概率),再通过对大量语料的学习可以得到映射关系。
例如,一组问答如下:
问:忙了一天,终于下班了。
答:辛苦了,现在回家吗?
通过对问答分别进行切词并提取其中的关键词,可以得到问中的关键词包括:忙、下班,而在答中的关键词包括:辛苦、回家,因此,可以建立“忙”与“辛苦”之间的映射关系,“下班”与“回家”之间的映射关系。
上述的映射关系可以是一对多的,例如,另一组语料如下:
问:忙了一天,终于下班了。
答:休息一下,工作完成了吗?
类似上述处理,可以建立“忙”与“休息”之间的映射关系,“下班”与“工作”之间的映射关系。
因此综合多种语料,可以建立“忙”与“辛苦”、“休息”之间的映射关系,“下班”与“回家”、“工作”之间的映射关系。
在得到上述的映射关系后,可以以键值对(key、value)的方式存储下来。如key是“忙”,value包括“辛苦”、“休息”。
由于语料可以来自不同的语料源,不同语料源可以具有不同的风格,因此可以形成不同风格的映射关系。
例如,一个电视剧中的一组对话包括:
问:我在想关于考试的事情呢。
答:那就是在想怎么作弊?
问:你怎么老把我往坏处想呢?
答:让我往好处想也得给我机会啊!
根据上述语料,可以建立一组具有诙谐幽默风格的映射关系,如“想”与“想”之间的映射关系,“考试”与“怎么作弊”之间的映射关系。
又例如,一个言情小说中的一组对话包括:
问:我在想关于考试的事情呢。
答:亲爱的,可是人家在想你呢。
根据上述语料,可以建立一组具有饱含情愫风格的映射关系,如“我”与“亲爱的”、“人家”之间的映射关系,“想”与“想”之间的映射关系,“考试”与“你”之间的映射关系。
又例如,在普通社交平台上,一组对话包括:
问:我在想关于考试的事情呢。
答:关于考试的什么事儿呢?
根据上述语料,可以建立一组具有普通生活风格的映射关系,如“想”与“想”之间的映射关系,“考试”与“什么”之间的映射关系。
又例如,在东北话中一组对话包括:
问:我在想关于考试的事情呢。
答:寻思啥呢,到考试就麻爪儿了吧?
根据上述语料,可以建立一组具有东北话风格的映射关系,如“想”与“寻思”之间的映射关系,“考试”与“麻爪”之间的映射关系。
S23:从人类对话语料中获取问题中的关键词和回答中的关键词,以及上下文信息,根据获取的关键词及上下文信息生成预测模型。
例如,问题中的关键词包括“忙”和“下班”,在一种语料中的上下文信息是“时间晚”、“想回家”等,相应的回答经常会出现“辛苦”、“回家”,则预测模型中包括如图4所示的问题、上下文信息、回答之间的对应关系。又例如,问题中的关键词包括“忙”和“下班”,在另一种语料中的上下文信息是“工作多晚”、“领导催”等,相应的回答经常会出现“休息”、“工作”、“完成”,则预测模型中包括如图5所示的问题、上下文信息、回答之间的对应关系。
图4-图5以逻辑上的关系进行了说明,但是预测模型中的上述关系不限于逻辑上的,还可以是风格上的,比如,对应同样的问题“想”、“考试,”参见图6,在不同风格下,可以对应不同的回答。
进一步的,预测模型不仅用于表示问题、上下文信息和回答之间的对应关系,还用于学习搭配,以根据回答中的关键词对其进行补充,搭配出句子。比如根据问题和上下文信息得到的回答包括“在、想、作弊”这些关键词,然后根据幽默诙谐的对话语料可以学习到相应风格中的常用搭配“在想、怎么作弊”;而在言情小说里,同样可以抽出“人家、想”的关键词,然后可以学到对应的富含情愫的搭配“亲爱的、想你”,最后学到这样一种包含情愫的搭配方式。
S24:分析人类对话语料的语法结构,生成语法模型。
语法模型的本质就是一个语言模型,该模型会根据语料中的对话去学习人类说话中的常用的语法结构,其主要原理是根据在对语料中对话pair预处理后的词性标注及序列的顺序去学习人类对话中的习惯表达方式,包括一些连接词和助词的添加和补充。比如在上文中当学习到“在想、怎么作弊”之后,语法模型去学习通过这两个短语去构建一个回答的语法结构,从而学习到去添加“那就是”这样的连接词;再例如上文在言情小说里面的对话,在reply中抽出与上文对应生成的“亲爱的、人家、想、你”之后,语法模型回去学习由这些term到最终reply“亲爱的,可是人家想你了呢”的表达方式,从而去学到“可是、呢”这些语气助词的使用,同时也学习到这种富含情愫的表达方式。在训练阶段,语法模型主要学习语料中语言的结构顺序和表达方式,结构顺序的学习会保证句子基本通顺,而表达方式上的学习也会随着语料风格的不同有所变化。
如上所示,在本实施例中可以生成映射关系、预测模型和语法模型,之后这些模型用于对话阶段。
本实施例中,通过收集人类对话语料,可以基于人类对话语料训练生成模型,从而使得机器学习到人类对话风格,在将模型应用到对话过程后,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。
结合上述的对话过程和训练过程,如图7所示,给出了一个总体架构图。
下面结合图7所示的架构,对包括训练过程和对话过程的整个流程进行说明。
图8是本申请另一个实施例提出的基于人工智能的人机交互方法的流程示意图。
如图8所示,本实施例包括:
S801:收集人类对话语料。
S802:对人类对话语料进行预处理。
预处理可以包括:对人类对话语料中的问题和答案分别进行切词,选取关键词及确定与每个关键词对应的标识(id),从而将词序列转换为id序列。
其中,可以获取包含词与标识之间对应关系的词典,根据该词典可以将词序列转换为对应的id序列。
该步骤可以由图7所示的预处理模块执行。
S803:根据预处理后的人类对话语料,生成问题中的关键词与回答中的关键词之间的映射关系,并存储该映射关系。
该步骤可以由图7所示的映射学习与存储模块执行。
具体的映射关系的生成流程可以参见上一实施例,在此不再详细说明。
另外,可以理解的是,由于在训练阶段进行了上述的预处理,因此上述的映射关系可以是id之间的映射关系。
S804:根据预处理后的人类对话语料生成预测模型。
该步骤可以由图7所示的预测模块执行。
具体的生成预测模型的流程可以参见上一实施例,在此不再详细说明。
S805:根据预处理后的人类对话语料生成语法模型。
该步骤可以由图7所示的语法学习与控制模块执行。
具体的生成语法模型的流程可以参见上一实施例,在此不再详细说明。
S801-S805可以在训练阶段执行。
另外,各模块之间的交互可以由图7所示的主控***执行。
S806:接收用户输入的问题。
S807:对用户输入的问题进行预处理。
预处理可以由预处理模块执行。具体的预处理流程可以参见上述训练阶段的相应流程。
S808:根据映射关系,确定与用户输入的问题中的关键词对应的回答中的关键词。
其中,主控***可以将预处理后问题传输给映射学习与存储模块,由映射学习与存储模块根据自身存储的映射关系确定与预处理后的问题对应的回答中的关键词。
S809:根据预测模型,在确定出的关键词中选择最优的一组关键词,并根据选择的一组关键词生成搭配词。
其中,主控***可以从映射学习与存储模块获取到多组关键词,之后主控***可以将这多组关键词传输给预测模块,并且由上下文记忆模块获取到当前的上下文信息,预测模块可以根据已生成的预测模型以及当前的上下文信息在多组关键词中选择出一组关键词。
例如,根据映射关系可以确定出多组关键词,比如,问题中的关键词包括“忙”和“下班”时,根据映射关系确定出的关键词可以包括“休息、工作、完成”和“辛苦,回家”,而在该步骤中,根据预测模型以及当前的上下文信息可以在确定出的多组关键词中选择出最优的一组关键词,例如,如果当前的上下文信息是“工作多,领导催”,则选择出的一组关键词是“休息,工作,完成”,或者,如果当前的上下文信息是“时间晚、想回家”,则选择出的一组关键词是“辛苦,回家”。
另外,预测模型还可以根据上下文信息确定当前的风格,再根据风格确定相应的搭配词语,比如选择的一组关键词为“在、想”,如果当前风格是幽默诙谐的,则可以确定出“在想、怎么作弊”这类的搭配词,或者,如果当前风格是饱含情愫,则可以确定出“亲爱的、想你”这类的搭配词。
S810:根据语法模型对选择的一组关键词及生成的搭配词进行语法结构调整,得到满足语法结构的句子。
其中,主控***可以从预测模块获取关键词及搭配词,之后将其传输给语法学习与控制模块,由语法学习与控制模块根据语法模型调整各词的顺序,以生成满足语法结构的句子。语法学习与控制模块采用的语法模型可以是训练阶段根据人类对话语料生成的,或者,也可以是根据开放接口从第三方获取的语法模型。
S811:将满足语法结构的句子作为回答反馈给用户。
例如,主控***从语法学习与控制模块获取满足语法结构的句子,之后对该句子进行语音合成,通过输出接口播放给用户。
进一步的,该方法还可以包括:
S812:根据与用户的交互对话,进行在线学习。
在与用户进行对话时,***可以实时产生一些对话的语料,这些语料是包含着当前用户的表达习惯和风格,因此,可以把一定时间内与用户对话的聊天记录作为语料去学习用户的表达习惯。该模块主要是定时收集对话记录作为语料对***各个模块进行实时重训,在聊天记录使用中,用户的每一次输入对从相对机器上一句的回答来说也是一个query,因此以机器上一步产生的回答作为query,以用户的输入作为answer作为一个个pair进行重训,让***在与用户对话的过程中去学习到用户的对话风格。该模块时一个可插拔的模块,在接上该模块时模块比不断通过日志中用户与机器的对话进行学习,在拆卸掉改模块时整个***也能够正常运行。
进一步的,该方法还可以包括:
S813:通过开放接口调用其他***或者被其他***调用。
如图7所示,该***还可以提供一些开放接口,这些开放接口是对外开放的调用接口和拓展接口,调用接口可以使其他***可以通过该接口直接调用本***,而拓展接口可以接入其他相关的模型或***进行功能强化,比如语法学习模块可以调用其他一些成熟的语言模型去强化***中的语法学习和调整的功能。
本实施例中,通过收集人类对话语料,可以基于人类对话语料训练生成模型,从而使得机器学习到人类对话风格,在将模型应用到对话过程后,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。进一步的,通过在线学习可以实时学习到新的数据,以提高人机交互效果。进一步的,通过开放接口可以被其他***调用或调用其他***,更好的提供人机交互服务。
图9是本申请一个实施例提出的基于人工智能的人机交互装置的结构示意图。
如图9所示,该装置90包括:接收模块91、获取模块92和反馈模块93。
接收模块91,用于接收用户输入的问题;
获取模块92,用于根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;
反馈模块93,用于将所述回答反馈给用户。
一些实施例中,所述模型包括:映射关系、预测模型和语法模型,所述映射关系用于表明问题中的关键词与回答中的关键词之间的映射关系,所述预测模型用于根据上下文信息在多种映射关系中确定出最优的一种映射关系,以及生成与确定出的映射关系中的关键词匹配的搭配词,所述语法模型用于调整词条顺序,根据调整后的词条生成符合语法结构的句子。
一些实施例中,参见图10,所述获取模块92包括:
映射子模块921,用于根据所述映射关系,确定与用户输入的问题中的关键词对应的回答中的关键词;
预测子模块922,用于根据所述预测模型,在确定出的关键词中选择最优的一组关键词,并根据选择的一组关键词生成搭配词;
语法分析子模块923,用于根据所述语法模型,对所述选择的一组关键词及生成的搭配词进行语法结构调整,得到满足语法结构的句子,作为具有人类对话风格的回答。
一些实施例中,所述映射子模块还用于:提取人类对话语料中问题中的关键词及对应的回答中的关键词,根据提取的关键词生成所述映射关系;或者,
一些实施例中,所述预测子模块还用于:提取人类对话语料中问题中的关键词及对应的回答中的关键词,以及提取对应的上下文信息,根据提取的关键词和上下文信息,生成所述预测模型;或者,
一些实施例中,所述语法分析子模块还用于:根据人类对话语料生成所述语法模型,或者,通过开放接口从其他***获取所述语法模型。
一些实施例中,参见图10,该装置90还包括:
预处理模块94,用于对所述问题进行预处理,以触发所述获取模块根据预先生成的模型对预处理后的问题进行处理。
一些实施例中,参见图10,该装置90还包括:
在线学习模块95,用于根据与所述用户的交互对话,进行在线学习。
一些实施例中,参见图10,该装置90还包括:
开放接口96,用于为调用其他***或被其他***调用提供接口。
可以理解的是,本实施例的装置与上述方法实施例对应,具体内容可以参见方法实施例的相关描述,在此不再详细说明。
本实施例中,通过收集人类对话语料,可以基于人类对话语料训练生成模型,从而使得机器学习到人类对话风格,在将模型应用到对话过程后,机器能够以人类对话风格与人类进行对话交互,使得人机交互具有真正的人类之间对话交互的效果。进一步的,通过在线学习可以实时学习到新的数据,以提高人机交互效果。进一步的,通过开放接口可以被其他***调用或调用其他***,更好的提供人机交互服务。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种基于人工智能的人机交互方法,其特征在于,包括:
接收用户输入的问题;
根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;
将所述回答反馈给用户;
其中,所述模型包括:映射关系、预测模型和语法模型,所述映射关系用于表明问题中的关键词与回答中的关键词之间的映射关系,所述预测模型用于根据上下文信息在多种映射关系中确定出最优的一种映射关系,以及生成与确定出的映射关系中的关键词匹配的搭配词,所述语法模型用于调整词条顺序,根据调整后的词条生成符合语法结构的句子。
2.根据权利要求1所述的方法,其特征在于,所述根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,包括:
根据所述映射关系,确定与用户输入的问题中的关键词对应的回答中的关键词;
根据所述预测模型,在确定出的关键词中选择最优的一组关键词,并根据选择的一组关键词生成搭配词;
根据所述语法模型,对所述选择的一组关键词及生成的搭配词进行语法结构调整,得到满足语法结构的句子,作为具有人类对话风格的回答。
3.根据权利要求1所述的方法,其特征在于,还包括:
提取人类对话语料中问题中的关键词及对应的回答中的关键词,根据提取的关键词生成所述映射关系。
4.根据权利要求1所述的方法,其特征在于,还包括:
提取人类对话语料中问题中的关键词及对应的回答中的关键词,以及提取对应的上下文信息,根据提取的关键词和上下文信息,生成所述预测模型。
5.根据权利要求1所述的方法,其特征在于,还包括:
根据人类对话语料生成所述语法模型,或者,通过开放接口从其他***获取所述语法模型。
6.根据权利要求1所述的方法,其特征在于,还包括:
对所述问题进行预处理,以根据预先生成的模型对预处理后的问题进行处理。
7.根据权利要求1所述的方法,其特征在于,还包括:
根据与所述用户的交互对话,进行在线学习。
8.根据权利要求1所述的方法,其特征在于,还包括:
通过开放接口调用其他***或者被其他***调用。
9.一种基于人工智能的人机交互装置,其特征在于,包括:
接收模块,用于接收用户输入的问题;
获取模块,用于根据预先生成的模型,对所述问题进行处理,获取与所述问题对应的具有人类对话风格的回答,所述模型是根据人类对话语料生成的;
反馈模块,用于将所述回答反馈给用户;
其中,所述模型包括:映射关系、预测模型和语法模型,所述映射关系用于表明问题中的关键词与回答中的关键词之间的映射关系,所述预测模型用于根据上下文信息在多种映射关系中确定出最优的一种映射关系,以及生成与确定出的映射关系中的关键词匹配的搭配词,所述语法模型用于调整词条顺序,根据调整后的词条生成符合语法结构的句子。
10.根据权利要求9所述的装置,其特征在于,所述获取模块包括:
映射子模块,用于根据所述映射关系,确定与用户输入的问题中的关键词对应的回答中的关键词;
预测子模块,用于根据所述预测模型,在确定出的关键词中选择最优的一组关键词,并根据选择的一组关键词生成搭配词;
语法分析子模块,用于根据所述语法模型,对所述选择的一组关键词及生成的搭配词进行语法结构调整,得到满足语法结构的句子,作为具有人类对话风格的回答。
11.根据权利要求10所述的装置,其特征在于,
所述映射子模块还用于:提取人类对话语料中问题中的关键词及对应的回答中的关键词,根据提取的关键词生成所述映射关系;或者,
所述预测子模块还用于:提取人类对话语料中问题中的关键词及对应的回答中的关键词,以及提取对应的上下文信息,根据提取的关键词和上下文信息,生成所述预测模型;或者,
所述语法分析子模块还用于:根据人类对话语料生成所述语法模型,或者,通过开放接口从其他***获取所述语法模型。
12.根据权利要求9所述的装置,其特征在于,还包括:
预处理模块,用于对所述问题进行预处理,以触发所述获取模块根据预先生成的模型对预处理后的问题进行处理。
13.根据权利要求9所述的装置,其特征在于,还包括:
在线学习模块,用于根据与所述用户的交互对话,进行在线学习。
14.根据权利要求9所述的装置,其特征在于,还包括:
开放接口,用于为调用其他***或被其他***调用提供接口。
CN201610803645.8A 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置 Active CN106469212B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201610803645.8A CN106469212B (zh) 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置
US16/317,526 US11645547B2 (en) 2016-09-05 2017-01-23 Human-machine interactive method and device based on artificial intelligence
EP17844812.2A EP3508991A4 (en) 2016-09-05 2017-01-23 HUMAN-MACHINE INTERACTION METHOD AND DEVICE ON THE BASIS OF ARTIFICIAL INTELLIGENCE
PCT/CN2017/072267 WO2018040501A1 (zh) 2016-09-05 2017-01-23 基于人工智能的人机交互方法和装置
JP2019501993A JP6726800B2 (ja) 2016-09-05 2017-01-23 人工知能に基づくヒューマンマシンインタラクション方法及び装置
KR1020197004771A KR102170563B1 (ko) 2016-09-05 2017-01-23 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610803645.8A CN106469212B (zh) 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置

Publications (2)

Publication Number Publication Date
CN106469212A CN106469212A (zh) 2017-03-01
CN106469212B true CN106469212B (zh) 2019-10-15

Family

ID=58230458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610803645.8A Active CN106469212B (zh) 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置

Country Status (6)

Country Link
US (1) US11645547B2 (zh)
EP (1) EP3508991A4 (zh)
JP (1) JP6726800B2 (zh)
KR (1) KR102170563B1 (zh)
CN (1) CN106469212B (zh)
WO (1) WO2018040501A1 (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649778B (zh) * 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN107168990A (zh) * 2017-03-28 2017-09-15 厦门快商通科技股份有限公司 基于用户性格的智能客服***及对话方法
US10963493B1 (en) * 2017-04-06 2021-03-30 AIBrain Corporation Interactive game with robot system
US10810371B2 (en) 2017-04-06 2020-10-20 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
US10839017B2 (en) 2017-04-06 2020-11-17 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system utilizing an advanced memory graph structure
US11151992B2 (en) 2017-04-06 2021-10-19 AIBrain Corporation Context aware interactive robot
US10929759B2 (en) 2017-04-06 2021-02-23 AIBrain Corporation Intelligent robot software platform
CN108733722B (zh) * 2017-04-24 2020-07-31 北京京东尚科信息技术有限公司 一种对话机器人自动生成方法及装置
US10628754B2 (en) * 2017-06-06 2020-04-21 At&T Intellectual Property I, L.P. Personal assistant for facilitating interaction routines
WO2018227462A1 (en) * 2017-06-15 2018-12-20 Microsoft Technology Licensing, Llc Method and apparatus for intelligent automated chatting
CN108304436B (zh) * 2017-09-12 2019-11-05 深圳市腾讯计算机***有限公司 风格语句的生成方法、模型的训练方法、装置及设备
CN110019702B (zh) * 2017-09-18 2023-04-07 阿里巴巴集团控股有限公司 数据挖掘方法、装置和设备
CN107818787B (zh) * 2017-10-31 2021-02-05 努比亚技术有限公司 一种语音信息的处理方法、终端及计算机可读存储介质
CN108010531B (zh) * 2017-12-14 2021-07-27 南京美桥信息科技有限公司 一种可视智能问询方法及***
CN108153875B (zh) * 2017-12-26 2022-03-11 北京金山安全软件有限公司 语料处理方法、装置、智能音箱和存储介质
CN108038230B (zh) * 2017-12-26 2022-05-20 北京百度网讯科技有限公司 基于人工智能的信息生成方法和装置
CN108711423A (zh) * 2018-03-30 2018-10-26 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN110471538B (zh) * 2018-05-10 2023-11-03 北京搜狗科技发展有限公司 一种输入预测方法及装置
CN109033428B (zh) * 2018-08-10 2021-09-10 深圳市磐创网络科技有限公司 一种智能客服方法及***
WO2020060151A1 (en) * 2018-09-19 2020-03-26 Samsung Electronics Co., Ltd. System and method for providing voice assistant service
CN109684453A (zh) * 2018-12-26 2019-04-26 联想(北京)有限公司 一种信息处理方法及电子设备
CN109840255B (zh) * 2019-01-09 2023-09-19 平安科技(深圳)有限公司 答复文本生成方法、装置、设备及存储介质
CN110069707A (zh) * 2019-03-28 2019-07-30 广州创梦空间人工智能科技有限公司 一种人工智能自适应互动教学***
CN110046242A (zh) * 2019-04-22 2019-07-23 北京六行君通信息科技股份有限公司 一种自动应答装置及方法
CN110223697B (zh) * 2019-06-13 2022-04-22 思必驰科技股份有限公司 人机对话方法及***
CN110689078A (zh) * 2019-09-29 2020-01-14 浙江连信科技有限公司 基于人格分类模型的人机交互方法、装置及计算机设备
KR102380397B1 (ko) * 2019-10-08 2022-03-31 채명진 IoT센서 및 인공지능을 이용한 스마트 빌딩 관리방법
CN111833854A (zh) * 2020-01-08 2020-10-27 北京嘀嘀无限科技发展有限公司 一种人机交互方法与终端、计算机可读存储介质
KR102385198B1 (ko) * 2020-06-25 2022-04-12 (주)아크릴 인공지능 간의 대화를 위한 대화생성 시스템 및 방법
CN113761144A (zh) * 2020-11-16 2021-12-07 北京沃东天骏信息技术有限公司 应答信息确定方法和装置
CN114519101B (zh) * 2020-11-18 2023-06-06 易保网络技术(上海)有限公司 数据聚类方法和***、数据存储方法和***以及存储介质
CN112667796B (zh) * 2021-01-05 2023-08-11 网易(杭州)网络有限公司 一种对话回复方法、装置、电子设备及可读存储介质
US11610581B2 (en) * 2021-02-05 2023-03-21 International Business Machines Corporation Multi-step linear interpolation of language models
CN113032540B (zh) * 2021-03-19 2023-06-23 北京百度网讯科技有限公司 人机交互方法、装置、设备和存储介质
CN113488030A (zh) * 2021-07-06 2021-10-08 思必驰科技股份有限公司 语音点餐方法、装置及***
CN113378583A (zh) * 2021-07-15 2021-09-10 北京小米移动软件有限公司 对话回复方法及装置、对话模型训练方法及装置、存储介质
CN116561286B (zh) * 2023-07-06 2023-10-27 杭州华鲤智能科技有限公司 一种对话方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天***及其实现方法
CN101763212A (zh) * 2009-04-30 2010-06-30 广东国笔科技股份有限公司 人机交互***及其相关***、设备和方法
CN104615646A (zh) * 2014-12-25 2015-05-13 上海科阅信息技术有限公司 智能聊天机器人***
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8543565B2 (en) * 2007-09-07 2013-09-24 At&T Intellectual Property Ii, L.P. System and method using a discriminative learning approach for question answering
WO2013155619A1 (en) * 2012-04-20 2013-10-24 Sam Pasupalak Conversational agent
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
KR101515413B1 (ko) * 2013-08-14 2015-04-29 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
KR102175539B1 (ko) 2013-10-18 2020-11-06 에스케이텔레콤 주식회사 사용자 발화 스타일에 따른 대화형 서비스 장치 및 방법
CN105095444A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 信息获取方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天***及其实现方法
CN101763212A (zh) * 2009-04-30 2010-06-30 广东国笔科技股份有限公司 人机交互***及其相关***、设备和方法
CN104615646A (zh) * 2014-12-25 2015-05-13 上海科阅信息技术有限公司 智能聊天机器人***
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***

Also Published As

Publication number Publication date
KR20190028793A (ko) 2019-03-19
JP2019528512A (ja) 2019-10-10
EP3508991A4 (en) 2020-02-12
US20190286996A1 (en) 2019-09-19
JP6726800B2 (ja) 2020-07-22
KR102170563B1 (ko) 2020-10-27
EP3508991A1 (en) 2019-07-10
CN106469212A (zh) 2017-03-01
US11645547B2 (en) 2023-05-09
WO2018040501A1 (zh) 2018-03-08

Similar Documents

Publication Publication Date Title
CN106469212B (zh) 基于人工智能的人机交互方法和装置
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
CN104350541B (zh) 能够将与用户的自然对话合并到其行为中的机器人,以及编程和使用所述机器人的方法
US20200395008A1 (en) Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models
US20170200075A1 (en) Digital companions for human users
Wu et al. Multimodal large language models: A survey
CN110263324A (zh) 文本处理方法、模型训练方法和装置
CN107958433A (zh) 一种基于人工智能的在线教育人机交互方法与***
JP7313455B2 (ja) 発話エージェント
CN114401438B (zh) 虚拟数字人的视频生成方法及装置、存储介质、终端
CN108804698A (zh) 基于人物ip的人机交互方法、***、介质及设备
CN110815234A (zh) 交互机器人的控制方法及控制服务器
Wilks et al. Some background on dialogue management and conversational speech for dialogue systems
CN112965603A (zh) 一种人机交互的实现方法和***
US20240021193A1 (en) Method of training a neural network
CN115442495A (zh) 一种ai演播室***
CN112150103B (zh) 一种日程设置方法、装置和存储介质
CN114661864A (zh) 一种基于受控文本生成的心理咨询方法、装置及终端设备
EP4256552A1 (en) System for reply generation
Zahariev et al. Conversational speech analysis based on the formalized representation of the mental lexicon
CN101128864A (zh) 对话用户接口
Labedzka Exploring Roboticness and Applicability of Voices to Social Robots
CN117540017A (zh) 用于智能设备人机交互的方法、装置和智能设备
CN117827322A (zh) 大语言模型驱动的虚拟人视频生成***及控制方法和介质
CN118170890A (zh) 一种回复文本的生成方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant