CN109918650A - 自动生成采访稿的采访智能机器人装置及智能采访方法 - Google Patents
自动生成采访稿的采访智能机器人装置及智能采访方法 Download PDFInfo
- Publication number
- CN109918650A CN109918650A CN201910109002.7A CN201910109002A CN109918650A CN 109918650 A CN109918650 A CN 109918650A CN 201910109002 A CN201910109002 A CN 201910109002A CN 109918650 A CN109918650 A CN 109918650A
- Authority
- CN
- China
- Prior art keywords
- user
- interview
- module
- answer
- original text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公布了一种自动生成采访稿的采访智能机器人装置及自动生成采访稿的智能采访方法,采访智能机器人装置包括采访模板、知识库、回答判别模块、关键词抽取模块、回答追问模块、语音合成模块、语音识别模块、文字输入模块、采访稿一键生成模块、情绪判别及调整模块、语速选择模块、检索模块;使用构建的采访模板结合检索的方式,根据用户回答问题的情况,按照不同逻辑支线进行采访,并且从用户回答中提取关键词信息,检索相应内容进行追问;通过提取关键词及采访模板匹配的方式,自动生成采访稿。本发明能够解决采访过程时聊天轮次少,聊天逻辑架构不清晰,语音识别不准确等问题。
Description
技术领域
本发明属于语言文字及语音处理领域,涉及智能采访技术,尤其涉及一种自动生成采访稿的采访机器人装置及智能采访方法。
背景技术
聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序,也可以称为语音助手,聊天助手,对话机器人等。它试图建立这样的程序:至少暂时性地让一个真正的人类认为他们正在和另一个人聊天。
目前市场上有各种类型的聊天机器人,比如有京东JIMI客服机器人,儿童教育机器人,小冰娱乐聊天机器人,Alexa家居控制、车载控制机器人,Viv全方位服务类型机器人等。这是从应用方向对聊天机器人的一种划分。
按照应用目的,聊天机器人划分为:目标驱动和无目标驱动聊天机器人。
目标驱动的聊天机器人指的是聊天机器人有明确的服务目标或者服务对象,比如客服机器人、儿童教育机器人、类似Viv的提供天气/订票/订餐等服务的服务机器人等,这种目标驱动的聊天机器人也可以称作特定领域的聊天机器人。
无目标驱动聊天机器人指的是聊天机器人并非为特定领域服务目的而开发,比如纯粹聊天或者出于娱乐聊天目的以及计算机游戏中的虚拟人物聊天机器人都属于此类。这种无明确任务目标的聊天机器人也可以称作为开放领域的聊天机器人。
按照技术手段,聊天机器人可以分为:检索式机器人,生成式聊天机器人和基于人工模板的机器人。
检索式聊天机器人走的是类似搜索引擎的路线,研发者事先存储好对话库并建立索引,聊天***接收到用户输入句子后,通过在对话库中以搜索匹配的方式进行应答内容提取。很明显,这种方式对对话库要求很高,需要对话库足够大,能够尽量多地匹配用户问句,否则会经常出现找不到合适回答内容的情形(因为在真实场景下用户说什么都是可能的),但它的好处是回答质量高,因为对话库中的内容都是真实的对话数据,表达比较自然。
基于人工模板的技术通过人工设定对话场景,并对每个场景编写针对性的对话模板,模板描述了用户可能的问题以及对应的答案。这个技术路线的好处是精准,目前市场上各种类似于Siri的对话机器人中都大量使用了人工模板的技术,其准确性是其他方法无法比拟的,但缺点是可扩展性较差。
生成式聊天机器人则采取不同的技术思路,在接收到用户输入句子后,采用一定技术手段自动生成一句话作为应答,这个路线机器人的好处是可能覆盖任意话题的用户问句,绝大多数技术都是在Encoder-Decoder(或者称作Sequence to Sequence)深度学习技术框架下改进的,缺点是生成应答句子质量很可能会存在问题,比如语句不通顺、句法错误等看上去比较低级的错误。
目标驱动型机器人主要使用检索和基于人工模板的方式实现,无目标驱动机器人近年来越来越多开始使用深度学习的方法,生成回答。无论哪类聊天机器人,目前都存在聊天轮次少,聊天逻辑架构不清晰等问题,且不具备自动从用户言语中提取信息,生成稿件的功能。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种自动生成采访稿的智能机器人装置及自动生成采访稿的智能采访方法,用以解决采访时聊天轮次少,聊天逻辑架构不清晰,语音识别不准确等问题。
本发明提供的技术方案是:
一种自动生成采访稿的采访智能机器人装置,包括采访模板、知识库、回答判别模块、关键词抽取模块、回答追问模块、语音合成模块、语音识别模块、文字输入模块、采访稿一键生成模块、情绪判别及调整模块、语速选择模块、检索模块;
采访模板包括采访对象的各种信息的多个子模块,包括人物基本信息、教育背景、工作状况、婚恋情况及未来展望等子模块;人物基本信息子模块,用于提问人物的基本信息,包括姓名、性别、籍贯、出生日期等,再根据用户相应的信息,回复问题;教育背景子模块,用于采访人物的教育背景,如初高中校园生活,大学校园生活等,从人物信息模块得到人物年龄后,采访人物很可能经历过的校园生活,再根据用户相应的信息,回复问题;根据人物的年龄和教育背景信息,判断人物是否可能已经工作,如果可能已经工作,则进入工作状况子模块,采访人物的工作经历及个人感受,再根据用户的相应回复,回答用户,与用户形成互动;婚恋情况子模块,主要用于采访用户的情感经历,先采访用户的恋爱经历,再结合人物基本信息模块得到的信息判断用户是否可能已经结婚,如果可能结婚,则接着采访用户的婚姻情况,包括孩子等,根据用户的回复,回复用户;未来展望子模块,经由上述几个模块了解用户基本信息后,采访用户对于未来的展望,并根据用户的回答,智能回复用户。
知识库模块主要存储了采访过程中,机器可能需要用到的知识,包括地理、年份、星座、名人出生日期、职业表等子模块;地理子模块,储存了各省包含的市,县等地名,在人物信息模块采访用户籍贯时使用;年份子模块,储存了1900年至2018年,每一年发生的大事件,在人物基本信息子模块,采访人物出生日期时使用,根据用户的回答,答复用户出生那年发生的大事件,营造和谐有趣的采访氛围;星座子模块,存放每个星座对应的出生日期和各星座对应的特点,人物基本信息子模块得到用户的出生月日之后,回复用户相应星座的特点,以促进采访的趣味性;名人出生日期子模块,存放了一年中每一天出生过的名人,在人物基本信息模块得到用户的出生日期后,随机回复用户和他生日一样的三个名人及其职业;职业表子模块,存储各职业及其相关特色,采访模块中工作状况模块能够获取用户的职业信息,根据用户职业回复相应的对话,给用户贴心的体验;
回答判别模块,过滤掉人们时常下意识使用的语气词,如:“哦”,“啊”,“呢”等,对用户答语的其余内容进行分析,判断用户是否已经回答了当前问题。如采访用户年龄时,回答判别模块将检验用户答语中是否有合理的数字(3-110之间),如果用户答语不包含数字或者所含数字不合理,则判断用户没有回答该问题,重复提问一次,若用户答语依旧不含期待的答案,则提问:“是不方便回答这个问题吗?”,如果用户回答不方便回答该问题,则答复:“好的,那就不强人所难了,我们进入下一个问题吧~”,如果用户回答方便回答该问题,则回复:“刚才没有听清,是否选择键盘输入?”,如果用户选择键盘输入,则用户使用智能装置配置的键盘,手动输入回答,如果用户选择不使用键盘输入,则重新提问,继续分析用户答语的信息。
关键词抽取模块,回答判别模块判别出用户当前回复包含采访所需的内容后,根据该问题对应的所有可能回复句式,抽取答案,如:“您叫什么名字?”,可能的回复有:“我叫XXX”,“我的名字是XXX”,“我姓X(X),名X(X)”等,相应提取:“叫”或“是”或“姓”和“名”等字后面的信息,则可以获得关键词(姓名)。
回答追问模块,采访过程中,为提升用户的交互体验,智能机器人装置根据用户的回答添加相关的问题进行追问,比如提问用户的兴趣爱好时,用户回答喜欢看电影,则追问用户最喜欢看哪部电影,最喜欢哪个影星等;对于关键词的相关信息不断迭代更新的情形,智能机器人装置将通过检索模块,在线检索相关问题进行追问。
语音合成模块,整个采访过程基于语音交互,语音合成模块将选定的智能答语(或采访词)由文本转换成语音,说给用户听。
语音识别模块,采访的过程基于语音进行交互,但是分析用户答语及抽取关键词的过程都是直接对文本进行操作,语音识别模块将用户的答语从语音转化为文本,以供智能机器人进行分析。
文字输入模块,在回答判别模块中,如果对于某一问题,用户觉得方便回答并且已经回答了,但是语音识别模块没有将用户答语的内容识别出来,或者,对于语音识别容易出错的问题,如:“请问您的姓名是?”之类,语音识别很容易出错别字的问题,用户选择键盘输入答案,则此时用户答语不再经过语音识别模块,而是通过文字输入模块,直接将用户在键盘上的输入作为回答。
采访稿一键生成模块,在每个采访问题提出后,用户的回复经过语音识别模块转化成文字,经过回答判别模块,确认已经回答了问题后,输入关键词抽取模块,将采访稿所需要的信息抽取出来填入采访稿或找到关键词对应的描述填入采访稿;待采访结束后,点击智能机器人装置的一键生成按钮,就能生成关于本次采访的全部采访稿。
情绪判别模块及调整模块,用于检测对应于某问题,用户的回复后的心情,如果用户心情低落,则检索当前话题相关的笑话作为回应调整用户的心情。对于某些话题,如:情感经历,用户可能会回忆起伤心的事情,因此对于此类比较敏感的话题,用户的答语需要经过情绪判别模块及调整模块,由训练好的神经网络模型判别当前用户的情绪,如果用户伤心,则回以笑话调节心情,如果用户开心或者中立,则继续采访。
语速选择模块,由于本智能机器人的人机交互几乎基于语音实现,双方语速较为接近能够让对话的进行更加融洽,和谐。因此在用户回答前三个问题时,根据其回复内容的平均语速,选择相应的语音合成语速,保证人机双方语速相差不多。
检索模块,关键词抽取模块中得到了用户回答中的关键词,对于一些随时会有更新情况的关键词,追问题库中不会存放相应的追问,而是在线检索,得到相关信息后再进行追问。
本发明还提供一种自动生成采访稿的智能采访方法,利用上述自动生成采访稿的智能机器人装置自动生成采访稿,使用人工构建的采访模板结合检索的方式,根据用户回答问题的情况,按照采访模板的不同模块或模块的某一逻辑支线进行采访,并且从用户回答中提取关键词信息,检索相应内容进行追问。通过提取关键词及采访模板匹配的方式,自动生成采访稿。包括如下步骤:
1.构建采访模板:
具体实施时,本发明按照采访需求和注意事项,人工构建了一套完整的采访模板。采访模板主要涉及人物基本信息,教育背景,工作状况,婚恋情况及未来展望等模块,对于不同人群选取不同的模块或同一模块中的不同逻辑支线进行提问。同一模块中的某些问题,具有多种回答,用户的不同回答将导致接下来提问的内容有较大差异。因此,在模板构建时考虑逻辑支线设计,根据各个子模块构建采访逻辑支线;每条逻辑支线相当于一个子模板。
比如:“你谈过恋爱吗?”,若用户回答有,则进入谈恋爱相关的逻辑支线,如通过“你和你另一半的第一次见面是怎样的?”,“你表达爱意的最特别的方式是?”,“要维系一段感情,你觉得最重要的是什么?”等问题,采访用户的过往感情经历及感受;若用户回答没有谈过恋爱,则进入对恋爱畅想的逻辑支线,采访用户对于恋爱的设想,如通过“你的伴侣理想型是?为什么?”,“渴望开展一段恋情吗?你对恋爱的态度是?”等问题,采访用户对于恋爱的展望等。设计采访模板时,会在每一部分考虑到用户的不同情况,设计多个逻辑支线,逻辑支线的分支点主要有:是否上大学,是否工作,是否谈过恋爱,是否结婚,是否有孩子等。
在人物基本信息模块,主要提问人物的姓名,性别,籍贯,出生日期等。根据用户相应的信息,回复问题。如用户回答:“我是乌鲁木齐人”,***会随机回答“新疆大盘鸡,格子流口水了”或“格子感觉新疆人都很美,像混血儿”或“新疆有克拉玛依大油田哦”等。根据用户出生不同的年份、月份,本发明也会回复带有相应年代特色及星座的答语。
本发明具体实施时,得到人物基本信息之后根据年龄,划分了3条逻辑支线:
逻辑支线为采访时提问题的路径,指的是当一个问题具有不同回答时,根据这个回答确定后续提问的一系列不同的子问题(即逻辑支线表示为多个子模板)。针对22岁以下的用户,主要采访他们的童年回忆,求学经历,恋爱经历和兴趣爱好等。并结合用户回答,进入相应逻辑支线。比如用户是否谈过恋爱,如果用户谈过则进入谈过恋爱的逻辑支线,采访用户的过往感情经历及感受;用户没谈过恋爱,则进入没谈过恋爱的支线,采访用户对于恋爱的展望等。逻辑支线内容采访结束,再回到主逻辑线,接着采访用户的兴趣爱好,并根据用户回答进行追问,如询问用户的兴趣爱好时,如果用户喜欢音乐,就接着询问用户喜爱的乐曲,歌手等;如果用户喜欢看电影,就询问其喜爱的演员,影片类型等。
针对22-30岁的用户,主要采访他们的求学经历,工作经历,婚恋情况,兴趣爱好及未来展望等。并且针对用户不同的情况,选择相应的逻辑支线提问。比如询问用户是否上过大学,如果用户上过大学,则进入大学生活的逻辑支线,通过:“你为什么决定上大学?”,“你选了哪个专业?为什么呢?”,“你有参加过社团组织吗?你觉得这个经历怎么样?”等问题,采访用户的大学经历和感想;如果用户没有上过大学,就演着主逻辑支线,采访用户是否在工作,如果用户已经工作,则进入工作的逻辑支线,通过:“现在做什么工作哦?”“目前为止,你跳槽过几次了呢?”等问题询问用户的工作情况,如果用户尚未工作,则接着主逻辑支线,询问用户的婚恋情况。如果用户未婚,则进入未婚的逻辑支线,采访用户对于恋爱的看法以及对未来的展望;如果用户已婚,则通过“你觉得婚前和婚后的生活最大的改变是什么?”,“如果再给你一次机会,还会选择结婚吗?”等问题采访用户对于婚姻的看法。之后进入逻辑节点,询问用户是否有孩子,如果用户有孩子,通过“你有几个孩子呀?”“关于孩子的教育,你觉得最重要的是什么?”等问题采访用户和孩子的相处情况,对于教育孩子成长的看法等;如果用户没有孩子,则通过:“喜欢小孩子吗?为什么?”等问题,询问用户对于孩子的看法。
针对30岁以上的用户,主要采访工作经历,兴趣爱好,婚恋情况及未来展望等。并且对于不同用户的回答,进入相应的逻辑支线进一步提问。主要逻辑支线的分支点依旧是:是否上大学,是否工作,是否谈过恋爱,是否结婚,是否有孩子等。
2.构建知识库为保持采访过程氛围轻松愉悦,灵活度高,提升用户的体验,我们通过搭建知识库,从知识库中抽取信息填入模板的方式与用户进行互动。
主要构建的知识库有:
(1)中国各省省会地级市和县级市列表;
具体使用时,只要用户说出一个地名,采访机器人将回复具有地区特色的回答。地名之间的关系是词典的形式存储起来的,每个省或直辖市作为key,相应的市或县作为value;省或直辖市对应的特色描述也是通过词典的方式进行存储的,地名是key,相应描述是value。
(2)年份知识库,记录了近百年重要事件及其发生的年份;采用词典方式表示;
用户回答出生年份后,本发明将回复相应年份有关的信息。年份知识库是由词典表示的,年份是key,重要事件是value,根据用户回答的年份找到对应的value作为答语。
(3)星座知识库,采用词典方式存储星座及其对应的描述;
根据用户的出生日期,机器人回复用户含有相应星座信息的消息。用词典表示,星座是key,星座对应的描述是value。
(4)名人出生日期表,该表存储了历史上每月每日出生的名人;
采访机器人得到用户出生日期的信息后,将告诉用户历史上有哪些名人和用户具有相同的生日。月日是key,对应生日的名人及其职业为value,一个key可能对应了很多value,每次随机挑选出三个value作为回复用户的答语。
(5)职业表,里面存储了各职业及其相关特色;
根据用户的回复,随机抽取用户职业的某一特色进行回答,如果用户是程序员,就说:“听说程序员总加班,很辛苦呢”或者“程序员们都可严谨了”等。Key是职业,value是相应职业对应的候选描述,每次随机从多个value中选取其中一个进行回复。(6)追问题库,里面存储了若干采访过程中可能出现的关键词,及其相关追问。如:关键词“电影”对应的追问是“你最喜欢哪部电影呀?”,“最喜欢的影星是谁”等。Key是电影,value是相关追问,每次随机从value中选取一个问题进行追问。
3.抽取关键词,判别及追问;
对于在采访过程中用户的回答,对于答案类型较为特别的回复,如年龄,生日等含有数字,我们通过正则匹配,寻找用户回复中的数字,如果含有合理数字则视为已经回复,如果不含合理数字,则重复提问;对于答案类型灵活多变的回复,我们通过计算用户答语和问题的重合词语数目,用户答语和答案模板的重合词语数目进行评估,判断用户是否回答了问题,如果用户没有进行回答,则重复提问;如果用户已经回答了,就根据用户回答的内容进行追问。
对于追问,根据用户的回答,如果用户回答较短(除去“哦”“呃”“恩”等语气词后,回答低于2个字)或者追问次数达到两次则结束此轮对话,进行下一阶段的采访。否则,我们会提取出用户的回答中的关键词,然后基于提取出来的关键词,首先基于我们已有的追问问题库中进行检索,如果找到相应的问题则进行追问。如果追问问题库中没有对应条目,则在线检索,根据检索到的词条,基于检索结果的top20,再结合问题和用户的回答,进行筛选排序,选择与当前问题和用户回答相似度最高的词条进行追问(预先训练好词向量,使用word2vec模型计算句子间的相似度)。比如用户回答平时喜欢看综艺节目,我们将搜索带有综艺标签的视频,随机选取一些信息和用户进行互动,如:“最近明星大侦探很火呢,你看了吗?”等。
4.语音合成及语音识别与用户交互
具体实施时,本发明结合了科大讯飞的语音识别和语音合成接口,将模板问题通过语音合成技术转换成语音,向用户进行提问;将用户的回答通过语音识别技术,转换成文字进行分析。
5.文字输入
在回答判别时,如果对于某一问题,用户觉得方便回答并且已经回答了,但是语音识别模块没有将用户答语的内容识别出来,或者,对于语音识别容易出错的问题,如:“请问您的姓名是?”之类,语音识别很容易出错别字的问题,用户可以选择键盘输入答案,则此时用户答语不再经过语音识别模块,而是通过文字输入模块,直接将用户在键盘上的输入作为回答。这样避免了因为语音识别不准确带来的信息提取不准等问题。
6.一键生成采访稿
在采访过程中,应用语音识别技术将用户的回答转换成文字,使用正则匹配或模板匹配的方式提取用户回答中的关键词,去除用户回答中无意义的词汇后填入相应逻辑支线的模板,生成采访稿。
7.情绪判别及调整
在60万条微博数据的中文语料上训练好word2vec模型,用户的回答(用户答语)中的每个词使用word2vec得到对应的词向量,经过两层LSTM得到用户答语的句子级别的向量,将该向量输入到训练好的情感分类器后,得到用户答语的情感标签(开心,中立或难过)。如果是开心或中立的情感标签,则按照前面介绍过的流程进行采访;如果用户的答语进行情感分类后,结果是难过,则先检索当前话题相关的笑话作为回应再向用户进行提问。
情感判别器的训练:从中文情感分析数据集中,将句子进行分词,在数据集上训练词向量,将每个词对应的词向量输入至两层的神经网络(LSTM)提取句子信息,取最后一层网络的神经元的隐状态作为压缩后的句子信息表示,过一个Softmax层得到句子对应于负类(伤心),中立,正类(开心)三类情感的概率分布,概率最高的类别作为预测标签,计算预测标签与真实标签间的loss,训练网络。
训练好情感判别器之后,在实际应用阶段,输入用户答语即可获得该句的情感标签。
8.语速选择功能
对话时,双方语速比较匹配的话,交流能更加顺畅。因此用户回答第一个问题后,根据用户说话的语速,调整采访机器人输出的语速。
本发明的有益效果在于:
本发明通过构建采访模板,使用采访模板,精准和用户进行互动;并使用自己搭建的知识库,丰富互动内容,活跃氛围提升用户体验;结合提取关键词的技术,自动生成采访稿。本发明能够解决采访时聊天轮次少,聊天逻辑架构不清晰,语音识别少部分情况不够准确的问题,提升采访效果。
附图说明
图1为本发明所提供的智能机器人装置自动生成采访稿的方法流程框图。
图2为本发明所提供的情感判别框架示意图;
其中,Long Short-Term Memory(LSTM)表示长短期记忆网络;Softmax层为分类层,经过Softmax层得到句子对应于负类(伤心),中立,正类(开心)三类情感的概率分布,概率最高的类别作为预测标签。
具体实施方式
下面结合实施例和附图进一步阐明本发明所述的技术方案,但不以任何方式限制本发明的范围:
图1为本发明所提供的智能机器人装置自动生成采访稿的方法流程,如图1所示,本发明具体实施了一种基于智能模板选择的短新闻自动写稿方法,自动生成短新闻稿件;包括如下步骤:
11)构建模板
按照采访需求和注意事项,人工构建了一套完整的采访模板。采访模板主要涉及人物基本信息,教育背景,工作状况,婚恋情况及未来展望等模块,对于不同人群选取不同的模块或同一模块中的不同逻辑支线进行提问。
在人物基本信息模块,主要提问人物的姓名,性别,籍贯,出生日期等。根据用户相应的信息,回复问题。如用户回答:“我是乌鲁木齐人”,***会随机回答“新疆大盘鸡,格子流口水了”或“格子感觉新疆人都很美,像混血儿”或“新疆有克拉玛依大油田哦”等。根据用户出生不同的年份、月份,本发明也会回复带有相应年代特色及星座的答语。
得到人物基本信息之后根据年龄,划分了3条逻辑支线:
针对22岁以下的用户,主要采访他们的童年回忆,求学经历,恋爱经历和兴趣爱好等。并结合用户回答,进入相应逻辑支线。如询问用户的兴趣爱好时,如果用户喜欢音乐,就询问用户喜爱的乐曲,歌手等;如果用户喜欢看电影,就询问其喜爱的演员,影片类型等。
针对22-30岁的用户,主要采访他们的求学经历,工作经历,婚恋情况,兴趣爱好及未来展望等。并且针对用户不同的情况,选择相应的逻辑支线提问。比如询问用户的婚恋情况时,如果用户未婚,则采访用户对于婚姻的看法以及对未来的展望;如果用户已婚,则采访用户对于婚姻的看法后,询问用户是否有孩子,如果用户有孩子,进一步采访用户对于孩子教育成长的看法。
针对30岁以上的用户,主要采访工作经历,兴趣爱好,婚恋情况及未来展望等。并且对于不同用户的回答,进入相应的逻辑支线进一步提问。如询问用户的工作经历时,如果用户有过跳槽的经历,将采访其跳槽的看法。
12)构建知识库
为保持采访过程氛围轻松愉悦,灵活度高,提升用户的体验,我们通过搭建知识库,从知识库中抽取信息填入模板的方式与用户进行互动。
主要构建的知识库有:(1)中国各省省会地级市和县级市列表,只要用户说出一个地名,采访机器人将回复具有地区特色的回答。地名之间的关系是词典的形式存储起来的,每个省或直辖市作为key,相应的市或县作为value;省或直辖市对应的特色描述也是通过词典的方式进行存储的,地名是key,相应描述是value。(2)年份知识库,记录了近百年重要事件发生的年份,用户回答出生年份后,本发明将回复相应年份有关的信息。年份知识库是由词典表示的,年份是key,重要事件是value,根据用户回答的年份找到对应的value作为答语。(3)星座知识库,根据用户的出生日期,机器人回复用户含有相应星座信息的消息。用词典表示,星座是key,星座对应的描述是value。(4)名人出生日期表,该表存储了历史上每月每日出生的名人,采访机器人得到用户出生日期的信息后,将告诉用户历史上有哪些名人和用户具有相同的生日。月日是key,对应生日的名人及其职业为value,一个key可能对应了很多value,每次随机挑选出三个value作为回复用户的答语。(5)职业表,里面存储了各职业及其相关特色,根据用户的回复,随机抽取用户职业的某一特色进行回答,如果用户是程序员,就说:“听说程序员总加班,很辛苦呢”或者“程序员们都可严谨了”等。Key是职业,value是相应职业对应的候选描述,每次随机从多个value中选取其中一个进行回复。(6)追问题库,里面存储了若干采访过程中可能出现的关键词,及其相关追问。如:关键词“电影”对应的追问是“你最喜欢哪部电影呀?”,“最喜欢的影星是谁”等。Key是电影,value是相关追问,每次随机从value中选取一个问题进行追问。
2)选取采访内容
若是刚开始采访,则提问用户姓名,性别等基本信息;若是采访过程中,则根据用户上一个问题的回复,提取出关键词进行判别,看是否需要重新提问(用户没有回答上一个问题的话),如果用户回答了该问题则判别用户回答的情感倾向,如图2所示,输入用户答语,判读用户的情绪,如果情感开心或中立,则从模板或知识库中选取回复,情感难过,则检索一个与当前对话主题相关的笑话进行回复后,再接着采访。
图2中,Long Short-Term Memory(LSTM)表示长短期记忆网络,是一种时间递归神经网络,适合处理和预测时间序列中间隔和延迟相对较长的重要事件;LSTM在自然语言处理的相关任务中起着比较重要的作用。情感判别器的训练:具体地,从中文情感分析数据集中,将句子进行分词,在数据集上训练词向量,将每个词对应的词向量输入至两层的神经网络(LSTM)提取句子信息,取最后一层网络的神经元的隐状态作为压缩后的句子信息表示,过一个Softmax层得到句子对应于负类(伤心),中立,正类(开心)三类情感的概率分布,概率最高的类别作为预测标签,计算预测标签与真实标签间的loss,训练网络。训练好情感判别器之后,在实用阶段,输入用户答语即可获得该句的情感标签。
3)语音合成
使用语音合成技术将采访内容由文字转化为语音。
4)语音识别
通过语音识别技术将用户的回答,从语音转换成文字。
5)文字输入
对于语音识别容易出错的答语对应的问题(如“请问您的姓名是?”,姓名的字很容易出错),或者用户觉得方便回答但是语音识别不能将答案正确转换,导致重复提问的问题,用户可以选择使用装置配置的键盘,文字输入问题的答案。
6)关键词提取
由正则匹配或模板匹配,提取出用户回答中的关键词。如果答案的类型比较特殊,如采访年龄时,答案应该是一个数字,则通过匹配用户答语中的数字进行抽取;如果答案类型就是普通文本,则根据该问题对应的所有可能回复句式,抽取答案,如:“您叫什么名字?”,可能的回复有:“我叫XXX”,“我的名字是XXX”,“我姓X(X),名X(X)”等,相应提取:“叫”或“是”或“姓”和“名”等字后面的信息,则可以获得关键词(姓名)。
7)生成采访稿
如果某个逻辑支线具有多个模板,则随机挑选一个模板,根据模板和用户答语,将提取出来的关键词,填入相应逻辑支线的模板中,生成采访稿。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (11)
1.一种自动生成采访稿的采访智能机器人装置,其特征是,包括采访模板、知识库模块、回答判别模块、关键词抽取模块、回答追问模块、语音合成模块、语音识别模块、情绪判别及调整模块、采访稿一键生成模块;
采访模板包括采访对象的各种信息的多个子模块,包括人物基本信息、教育背景、工作状况、婚恋情况及未来展望子模块;
知识库模块用于存储采访过程中可能需要用到的知识,包括地理、年份、星座、名人出生日期、职业表子模块;
回答判别模块,用于对用户答语进行过滤与分析,判断用户是否已经回答了当前问题,识别用户当前回复是否包含采访所需的内容;
关键词抽取模块,用于当回答判别模块识别出用户当前回复包含采访所需的内容后,根据用户对该问题回复的句式,通过匹配抽取答案,获得问题回复的关键词;
回答追问模块,用于根据用户的回答添加相关的问题进行追问;
语音合成模块,用于在基于语音交互的采访过程中,将选定的智能答语或采访词由文本转换成语音;
语音识别模块,用于将用户的答语从语音转化为文本,文本可用于分析用户答语及抽取关键词的过程;
情绪判别模块及调整模块,用于检测对应于某问题用户回复后的心情,以进一步确定采访策略;
采访稿一键生成模块,包括采访问题提出、用户回复转化成文字、进行回答判别、抽取关键词,再将采访稿所需要的信息抽取出来填入采访稿,或找到关键词对应的描述填入采访稿,即可生成关于本次采访的全部采访稿。
2.如权利要求1所述自动生成采访稿的智能机器人装置,其特征是,所述智能机器人装置还包括文字输入模块、语速选择模块和/或检索模块;
文字输入模块用于当用户选择键盘输入时将用户在键盘上的输入作为回答;
语速选择模块用于根据用户回答问题的平均语速选择相应的语音合成语速,使得人机双方语速接近;
检索模块用于在采访过程中随时更新的关键词,通过在线检索得到相关信息后再进行追问。
3.如权利要求1所述自动生成采访稿的智能机器人装置,其特征是,采访模板的人物基本信息子模块,用于提问人物的基本信息,再根据用户相应的信息回复问题;教育背景子模块,用于采访人物的教育背景,再根据用户相应的信息,回复问题;
工作状况子模块,用于采访人物的工作经历及个人感受,再根据用户的相应回复,回答用户,与用户形成互动;
婚恋情况子模块,用于采访用户的情感经历,包括用户的恋爱经历、婚姻情况,根据用户的回复,回复用户;
未来展望子模块,用于在了解用户基本信息后,采访用户对于未来的展望,并根据用户的回答,智能回复用户。
4.如权利要求1所述自动生成采访稿的智能机器人装置,其特征是,知识库模块的地理子模块用于储存各地名,可与采访用户籍贯时建立关联并使用相关信息;年份子模块用于储存每一年发生的大事件,可与采访人物出生日期关联使用;星座子模块用于存放每个星座对应的出生日期和各星座对应的特点,可与用户的出生月日关联相应星座;名人出生日期子模块用于存放名人出生日期及相关信息,可与用户的出生日期建立关联使用;职业表子模块,用于存储职业及其相应相关特色,可与用户的职业信息建立关联使用。
5.一种自动生成采访稿的智能采访方法,构建采访模板,根据用户回答问题的情况,按照采访模板的不同子模块或子模块提供的逻辑支线进行采访,并可从用户回答中提取关键词信息检索相应内容,进行追问;通过提取关键词及采访模板进行匹配的方式,自动生成采访稿;包括如下步骤:
1)构建采访模板:采访模板包括采访对象各种信息的多个子模块,包括人物基本信息、教育背景、工作状况、婚恋情况及未来展望子模块;根据各个子模块构建采访逻辑支线;每条逻辑支线可作为采访模板的一个子模板;
2)构建知识库模块,包括地理、年份、星座、名人出生日期、职业表子模块;
3)采访过程,执行如下操作:
31)针对不同人群选取不同的子模块或同一子模块的不同采访逻辑支线进行提问;
32)采用从知识库模块中抽取信息填入采访模板的方式与用户进行互动;
33)抽取关键词,判别及追问;具体包括如下步骤:
331)对于采访过程中用户的回答,对用户答语进行过滤与分析,判断用户是否已经回答了当前问题,识别用户当前回复是否包含采访所需的内容;
332)根据用户对该问题回答的句子,通过匹配抽取答案,获得问题回复的关键词;
333)根据关键词在已有的追问问题库中进行检索,如果找到相应的问题则进行追问;如果追问问题库中没有对应条目,则进行在线检索,根据检索到的词条,基于检索结果的前几条词条,再结合问题和用户的回答,进行筛选排序,选择与当前问题和用户回答相似度最高的词条进行追问;
4)采访过程中进行语音合成及语音识别与用户交互:通过语音识别和语音合成接口,将采访模板问题通过语音合成技术转换成语音,向用户进行提问;或将用户的回答通过语音识别技术,转换成文字进行分析;
5)采访过程中,对于语音识别难以得到准确文字回复的问题,可通过选择文字输入方式,直接将用户在键盘上的输入作为回答;
6)采访过程中进行情绪判别,输入用户答语获得情感标签,并根据情感标签调整采访流程;执行如下操作:
61)利用中文语料训练word2vec模型;利用中文情感分析数据集训练情感判别器;
62)将用户答语中的每个词输入训练好的word2vec,得到对应的词向量;经过两层LSTM得到用户答语的句子级别的向量;
63)将该句子级别的向量输入到训练好的情感分类器,得到用户答语的情感标签;
64)按照情感标签类别,确定后续采访流程;
7)采访过程中进行语速选择和调整:采访对话时,当用户回答问题后,根据用户语速,调整采访机器人输出的语速;
8)一键生成采访稿:在采访过程中,应用语音识别技术将用户的回答转换成文字,使用正则匹配或模板匹配的方式提取用户回答中的关键词,去除用户回答中无意义的词汇后填入相应逻辑支线的模板,即可生成采访稿;
通过上述步骤,实现自动生成采访稿的智能采访。
6.如权利要求5所述自动生成采访稿的智能采访方法,其特征是,所述逻辑支线为采访时提问题的路径,表示为采访模板的多个子模板,当一个问题具有不同回答时,根据回答确定后续提问的子问题。
7.如权利要求5所述自动生成采访稿的智能采访方法,其特征是,具体地,采访过程中,根据人物基本信息中采访用户的年龄,划分三条逻辑支线:
第一条逻辑支线,针对22岁以下的用户,采访提问主要针对童年回忆、求学经历、恋爱经历和兴趣爱好;并结合用户回答,关联相应信息进一步提问;
第二条逻辑支线,针对22-30岁的用户,采访提问主要针对求学经历、工作经历、婚恋情况、兴趣爱好及未来展望;并针对用户不同的情况,关联相应信息进一步提问;
第三条逻辑支线,针对30岁以上的用户,采访提问主要针对工作经历、兴趣爱好、婚恋情况及未来展望;并且对于不同用户的回答,关联相应信息进一步提问。
8.如权利要求5所述自动生成采访稿的智能采访方法,其特征是,具体地,构建知识库模块包括:
A.采用词典的形式构建地理知识库,存储地区的地名列表及具有地区特色的相应信息描述;
B.采用词典的形式构建年份知识库,存储近百年重要事件信息及其发生的年份;
C.星座知识库,采用词典方式存储星座及其对应的描述;
D.构建名人出生日期表,存储历史上每月每日出生的名人及其职业;
E.构建职业表,存储各职业及其相关特色。
9.如权利要求5所述自动生成采访稿的智能采访方法,其特征是,具体地,步骤333)预先训练好词向量,使用训练好的word2vec模型计算句子间的相似度,由此得到与当前问题和用户回答相似度最高的词条。
10.如权利要求5所述自动生成采访稿的智能采访方法,其特征是,训练情感判别器具体地,从中文情感分析数据集中,将句子进行分词;在数据集上训练词向量;将每个词对应的词向量输入至两层的神经网络LSTM提取句子信息;取最后一层网络的神经元的隐状态作为压缩后的句子信息表示;经过Softmax层得到句子对应的情感的概率分布;概率最高的类别作为预测标签;计算预测标签与真实标签间的损失函数loss,由此训练情感判别器网络。
11.如权利要求10所述自动生成采访稿的智能采访方法,其特征是,情感的概率分布分为负类、中立、正类三类;负类表示伤心;正类表示开心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910109002.7A CN109918650B (zh) | 2019-02-03 | 2019-02-03 | 自动生成采访稿的采访智能机器人装置及智能采访方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910109002.7A CN109918650B (zh) | 2019-02-03 | 2019-02-03 | 自动生成采访稿的采访智能机器人装置及智能采访方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109918650A true CN109918650A (zh) | 2019-06-21 |
CN109918650B CN109918650B (zh) | 2020-10-23 |
Family
ID=66961467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910109002.7A Active CN109918650B (zh) | 2019-02-03 | 2019-02-03 | 自动生成采访稿的采访智能机器人装置及智能采访方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918650B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211591A (zh) * | 2019-06-24 | 2019-09-06 | 卓尔智联(武汉)研究院有限公司 | 基于情感分类的面试数据分析方法、计算机装置及介质 |
CN110930106A (zh) * | 2019-10-14 | 2020-03-27 | 平安科技(深圳)有限公司 | 线上面试***的信息处理方法、装置和*** |
CN111046133A (zh) * | 2019-10-29 | 2020-04-21 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN111506770A (zh) * | 2020-04-22 | 2020-08-07 | 新华智云科技有限公司 | 一种采访视频集锦生成方法和*** |
CN112185383A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种用于客服回访的处理方法及*** |
CN112182169A (zh) * | 2019-07-01 | 2021-01-05 | 北京邮电大学 | 基于用户属性的社会工程学机器人模拟方法和装置 |
CN112307156A (zh) * | 2019-07-26 | 2021-02-02 | 北京宝捷拿科技发展有限公司 | 一种跨语种的智能辅助边检方法及*** |
WO2021073116A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 生成法律文书的方法、装置、设备和存储介质 |
CN113110767A (zh) * | 2020-01-10 | 2021-07-13 | 阿里巴巴集团控股有限公司 | 一种交互方法和装置 |
CN113208592A (zh) * | 2021-03-29 | 2021-08-06 | 济南大学 | 一种具有多作答模式的心理测试*** |
WO2022001161A1 (zh) * | 2020-06-29 | 2022-01-06 | 广州快决测信息科技有限公司 | 一种在线访谈的方法及*** |
CN113988070A (zh) * | 2021-10-09 | 2022-01-28 | 广州快决测信息科技有限公司 | 调研问题生成方法、装置、计算机设备和存储介质 |
CN114144773A (zh) * | 2019-08-01 | 2022-03-04 | 国际商业机器公司 | 基于人-机认知交互中的行为调整对话流 |
CN118246428A (zh) * | 2024-05-27 | 2024-06-25 | 成都溯笙文化传播有限公司 | 基于数字人实时交互和生成式人工智能的回忆录生成*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177623A1 (en) * | 2007-01-24 | 2008-07-24 | Juergen Fritsch | Monitoring User Interactions With A Document Editing System |
CN105975466A (zh) * | 2015-11-04 | 2016-09-28 | 新华通讯社 | 一种面向短新闻的机器写稿方法及装置 |
CN108062359A (zh) * | 2017-11-28 | 2018-05-22 | 歌尔科技有限公司 | 一种机器人采访与撰稿的方法和采访与撰稿的机器人 |
CN108831450A (zh) * | 2018-03-30 | 2018-11-16 | 杭州鸟瞰智能科技股份有限公司 | 一种基于用户情绪识别的虚拟机器人人机交互方法 |
CN109255697A (zh) * | 2018-08-15 | 2019-01-22 | 普信恒业科技发展(北京)有限公司 | 一种基于人工智能的自动信用评估方法和*** |
-
2019
- 2019-02-03 CN CN201910109002.7A patent/CN109918650B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080177623A1 (en) * | 2007-01-24 | 2008-07-24 | Juergen Fritsch | Monitoring User Interactions With A Document Editing System |
CN105975466A (zh) * | 2015-11-04 | 2016-09-28 | 新华通讯社 | 一种面向短新闻的机器写稿方法及装置 |
CN108062359A (zh) * | 2017-11-28 | 2018-05-22 | 歌尔科技有限公司 | 一种机器人采访与撰稿的方法和采访与撰稿的机器人 |
CN108831450A (zh) * | 2018-03-30 | 2018-11-16 | 杭州鸟瞰智能科技股份有限公司 | 一种基于用户情绪识别的虚拟机器人人机交互方法 |
CN109255697A (zh) * | 2018-08-15 | 2019-01-22 | 普信恒业科技发展(北京)有限公司 | 一种基于人工智能的自动信用评估方法和*** |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211591A (zh) * | 2019-06-24 | 2019-09-06 | 卓尔智联(武汉)研究院有限公司 | 基于情感分类的面试数据分析方法、计算机装置及介质 |
CN110211591B (zh) * | 2019-06-24 | 2021-12-21 | 卓尔智联(武汉)研究院有限公司 | 基于情感分类的面试数据分析方法、计算机装置及介质 |
CN112182169A (zh) * | 2019-07-01 | 2021-01-05 | 北京邮电大学 | 基于用户属性的社会工程学机器人模拟方法和装置 |
CN112307156A (zh) * | 2019-07-26 | 2021-02-02 | 北京宝捷拿科技发展有限公司 | 一种跨语种的智能辅助边检方法及*** |
CN114144773B (zh) * | 2019-08-01 | 2022-10-28 | 国际商业机器公司 | 基于人-机认知交互中的行为调整对话流 |
CN114144773A (zh) * | 2019-08-01 | 2022-03-04 | 国际商业机器公司 | 基于人-机认知交互中的行为调整对话流 |
CN110930106A (zh) * | 2019-10-14 | 2020-03-27 | 平安科技(深圳)有限公司 | 线上面试***的信息处理方法、装置和*** |
WO2021073116A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 生成法律文书的方法、装置、设备和存储介质 |
CN111046133B (zh) * | 2019-10-29 | 2023-07-25 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN111046133A (zh) * | 2019-10-29 | 2020-04-21 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN113110767B (zh) * | 2020-01-10 | 2024-07-23 | 阿里巴巴集团控股有限公司 | 一种交互方法和装置 |
CN113110767A (zh) * | 2020-01-10 | 2021-07-13 | 阿里巴巴集团控股有限公司 | 一种交互方法和装置 |
CN111506770A (zh) * | 2020-04-22 | 2020-08-07 | 新华智云科技有限公司 | 一种采访视频集锦生成方法和*** |
CN111506770B (zh) * | 2020-04-22 | 2023-10-27 | 新华智云科技有限公司 | 一种采访视频集锦生成方法和*** |
WO2022001161A1 (zh) * | 2020-06-29 | 2022-01-06 | 广州快决测信息科技有限公司 | 一种在线访谈的方法及*** |
US12045780B2 (en) | 2020-06-29 | 2024-07-23 | Guangzhou Quick Decision Iinformation Technology Co., Ltd. | Online interview method and system |
CN112185383A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种用于客服回访的处理方法及*** |
CN113208592B (zh) * | 2021-03-29 | 2022-08-16 | 济南大学 | 一种具有多作答模式的心理测试*** |
CN113208592A (zh) * | 2021-03-29 | 2021-08-06 | 济南大学 | 一种具有多作答模式的心理测试*** |
CN113988070A (zh) * | 2021-10-09 | 2022-01-28 | 广州快决测信息科技有限公司 | 调研问题生成方法、装置、计算机设备和存储介质 |
CN118246428A (zh) * | 2024-05-27 | 2024-06-25 | 成都溯笙文化传播有限公司 | 基于数字人实时交互和生成式人工智能的回忆录生成*** |
Also Published As
Publication number | Publication date |
---|---|
CN109918650B (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918650A (zh) | 自动生成采访稿的采访智能机器人装置及智能采访方法 | |
Long et al. | Literary pattern recognition: Modernism between close reading and machine learning | |
Allan | Frontier crossings: Cultural dissonance, intercultural learning and the multicultural personality | |
Novenson | The Grammar of Messianism: An Ancient Jewish Political Idiom and Its Users | |
Papafragou | On metonymy | |
Nyatsanga et al. | A Comprehensive Review of Data‐Driven Co‐Speech Gesture Generation | |
CN111400506B (zh) | 古诗词命题方法及*** | |
CN110232180B (zh) | 一种面向古诗词测评的自动命题方法和*** | |
CN109871439A (zh) | 一种基于深度学习的问答社区问题路由方法 | |
CN113610680A (zh) | 一种基于ai的交互式阅读材料个性化推荐方法及*** | |
Ćatibušić et al. | Immigrant Pupils Learn English | |
CN113298367A (zh) | 一种主题公园感知价值评估方法 | |
Šipka | Lexical layers of identity: Words, meaning, and culture in the Slavic languages | |
Hutson et al. | The poetry of prompts: the collaborative role of generative artificial intelligence in the creation of poetry and the anxiety of machine influence | |
Akhmanova | Optimization of natural communication systems | |
CN117556802B (zh) | 一种基于大语言模型的用户画像方法、装置、设备及介质 | |
Leaver et al. | Liturgy and music: Lifetime learning | |
CN110675292A (zh) | 一种基于人工智能的儿童语言能力评测方法 | |
Naselli | DA Carson’s theological method | |
Snyder | Language and identity in ancient narratives: the relationship between speech patterns and social context in the Acts of the Apostles, Acts of John, and Acts of Philip | |
CN111625631A (zh) | 一种选择题选项生成方法 | |
CN107832304A (zh) | 一种基于消息文本判断用户性别的方法和*** | |
Antar | The Effectiveness of Using ChatGPT4 in Creative Writing in Arabic: Poetry and Short Story as a Model | |
Moitra | Machine Masquerades a Poet: Using Unsupervised T5 Transformer for Semantic Style Transformation in Poetry Generation | |
Budiarti et al. | Analysis of Figurative Language on Song Lyrics Provided in “Pathway to English” Textbook Published by Erlangga for Eleventh Grades of Senior High School |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |