CN109166572A - 机器人阅读的方法和阅读机器人 - Google Patents
机器人阅读的方法和阅读机器人 Download PDFInfo
- Publication number
- CN109166572A CN109166572A CN201811058514.7A CN201811058514A CN109166572A CN 109166572 A CN109166572 A CN 109166572A CN 201811058514 A CN201811058514 A CN 201811058514A CN 109166572 A CN109166572 A CN 109166572A
- Authority
- CN
- China
- Prior art keywords
- user
- voice messaging
- reading
- requirement
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000003993 interaction Effects 0.000 claims abstract description 79
- 230000002452 interceptive effect Effects 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- 101100010343 Drosophila melanogaster lobo gene Proteins 0.000 description 1
- 241001248531 Euchloe <genus> Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Manipulator (AREA)
- Toys (AREA)
Abstract
本发明揭示了一种机器人阅读的方法和阅读机器人,其中,机器人阅读的方法,包括:接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;执行和用户的阅读需求相对应的阅读指令。在机器人接收到用户的阅读需求语音信息后,通过和语音信息匹配的人机互动模型与用户进行会话,实现人机的互动,以确定用户的具体阅读需求,增加了用户对收听机器人阅读的乐趣。
Description
技术领域
本发明涉及机器人领域,尤其涉及到一种机器人阅读的方法和阅读机器人。
背景技术
随着机器人技术的不断发展,智能机器人越来越多的被应用于人类的家庭生活中。例如,用户对利用智能机器人进行读书、听书、听力、读报、资料搜索的语音播报、语音电话方面的需求越来越多。
然而,当前的用于阅读的机器人大都是通过语音指令来使得机器人机械性的翻书,或者摄像头扫描来进行阅读。无论哪种,都对阅读的位置有一定的要求,而且阅读的过程中,人与机器没有任何的互动,这样在使用的方便性上,小孩子的乐趣上都有所缺陷。
为了提高智能机器人的用户体验,需要提高智能机器人的交互能力,以满足用户日益增长的需求。
发明内容
本发明的主要目的为提供机器人阅读的方法和阅读机器人,旨在解决现有阅读机器人中,用户与机器人缺少互动,不能引起小孩子的乐趣的技术问题。
本发明提供一种机器人阅读的方法,包括:
接收用户发出的语音信息,该语音信息为用户根据阅读需求发出的符合预设规则的语音信息;
通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;
执行和用户的阅读需求相对应的阅读指令。
进一步地,在接收用户发出的语音信息的步骤之前,还包括:
录入预设的音频资源,并按照特定的规则构建人机互动模型,预设的音频资源为执行阅读指令所进行阅读播放的客体。
进一步地,按照特定的规则构建人机互动模型的步骤,包括:
录入需求指令关键词和对应需求指令关键词的需求反馈话术;
识别需求指令关键词的语义;
根据需求指令关键词的语义和需求反馈话术建立匹配关系,以构建人机互动模型。
进一步地,通过和语音信息匹配的人机互动模型与用户进行会话的步骤,包括:
识别语音信息中的需求指令关键词的语义;
根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术;
通过所确定的需求反馈话术对语音信息进行反馈。
进一步地,根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术的步骤之前,包括:
在待机模式下,若语音信息中的需求指令关键词的语义表示为唤醒要求,则从待机模式转为工作模式。
本发明还提供一种阅读机器人,包括:
接收模块,用于接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;
互动模块,用于通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;
执行模块,用于执行和用户的阅读需求相对应的阅读指令。
进一步地,阅读机器人还包括:
资源录入模块,用于录入预设的音频资源;
模型构建模块,用于按照特定的规则构建人机互动模型。
进一步地,模型构建模块包括:
话术录入单元,用于录入需求指令关键词和对应需求指令关键词的需求反馈话术;
话术识别单元,用于识别需求指令关键词的语义;
互动构建单元,用于根据需求指令关键词的语义和需求反馈话术建立匹配关系,以构建人机互动模型。
进一步地,互动模块包括:
语音识别单元,用于识别语音信息中的需求指令关键词的语义;
话术匹配单元,用于根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术;
语音回应单元,用于通过所确定的需求反馈话术对语音信息进行反馈。
进一步地,互动模块还包括:
唤醒单元:用于在待机模式下,若语音信息中的需求指令关键词的的语义表示为唤醒要求,则从待机模式转为工作模式。
本发明的有益效果:本发明提供的机器人阅读的方法,包括:接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;执行和用户的阅读需求相对应的阅读指令。在机器人接收到用户的阅读需求语音信息后,通过和语音信息匹配的人机互动模型与用户进行会话,实现人机的互动,以确定用户的具体阅读需求,增加了用户对收听机器人阅读的乐趣。
本发明提供的机器人,通过互动模块的设置,实现用户和机器人的互动交流,进而确认用户的最终阅读需求;通过执行模块的设置,让机器人执行相应阅读需求指令。通过资源录入模块的设置,根据用户的阅读需求,将想要使用的书籍、故事以及儿歌等音频资源提前录入机器人中,无需通过摄像头扫描书本来进行阅读,减少了机器人摆放位置的限制。
附图说明
图1本发明一实施例的机器人阅读的方法流程示意图;
图2本发明另一实施例的机器人阅读的方法流程示意图;
图3本发明一实施例的阅读机器人结构示意图;
图4本发明另一实施例的阅读机器人结构示意图;
图5本发明一实施例中的模型构建模块结构示意图;
图6本发明一实施例中的互动模块结构示意图;
图7本发明另一实施例中的互动模块结构示意图;
图8本发明第三实施例中的阅读机器人结构示意图;
图9本发明第四实施例中的阅读机器人结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,本发明一实施例的机器人阅读的方法,包括:
S1:接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;
S2:通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;
S3:执行和用户的阅读需求相对应的阅读指令。
上述步骤S1中,所述的阅读需求包括当下首次需要阅读某一篇文章、故事等;也可以是要求结束、中断一篇文章的阅读,改为阅读另一篇文章故事;也可以是停止阅读的需求。所述的符合预设规则的语音信息,是指在机器人中已预先建立了一些人机互动模型,设定了一定的对话规则,按照这些人机互动模型和对话规则发出阅读需求的语音信息,机器人接收并识别到的语音信息符合预先设定规则的语音信息,才能进行下一步的对话。
上述步骤S2中,机器人接收到阅读需求的语音信息后,匹配与该阅读需求语音信息对应的人机互动模型,采用的特定的话术反馈给用户,并与用户进行对话,比如:
小孩(用户)说:“我要阅读。”
机器人回答:“小朋友,您好,请问你想读哪本书籍?”
小孩回答:“大灰狼和小白兔的故事。”
机器人回答:“好的,想从第几页开始阅读?”
小孩回答:“第三页。”
机器人回答:“好的,马上执行。”
如此,即可从与用户的会话中获取出用户最终的阅读需求。
再比如,当用户改变主意,不想再继续收听机器人当下正在进行阅读的音频内容,想收听另一篇文章,或是听一首儿歌,则对话可如下:
小孩(用户)说:“我想换一篇阅读。”
机器人回答:“小朋友,您好,请问你想换哪一篇呢?”
小孩回答:“熊出没。”
机器人回答:“好的,想从第几页开始阅读?”
小孩回答:“第五页。”
机器人回答:“好的,马上执行。”
如此,即可从与用户的会话中获取出用户改变阅读的需求。
又比如,当用户不想继续收听机器人阅读的时候,可以让机器人停止阅读播放,对话可如下:
小孩(用户)说:“我不想听了,你辛苦了。”
机器人回答:“小朋友,请问你确定不听了吗?”
小孩回答:“是的,不想听了。”
机器人回答:“好的,小朋友,要不要听我给你唱首歌放松一下”
小孩回答:“不要了,我要去玩了。”
机器人回答:“好的,那我们下次再见。”
如此,经过对话征求确认用户是否真需要停止阅读,明确后便于停止阅读播放。
上述步骤S3中,机器人根据用户的阅读需求执行相应的阅读指令,如根据上述几种场景中的开始阅读、改变阅读内容或结束阅读等需求,执行开始阅读、改变阅读内容或结束阅读的指令。
本实施例的机器人阅读的方法,在机器人接收到用户的阅读需求语音信息后,通过匹配对应语音信息的人机互动模型与用户进行会话,实现用户与阅读机器人的互动,以确定用户的具体阅读需求,增加了用户对收听机器人阅读的乐趣。
参照图2,本实施例中,在接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息的步骤S1之前,还包括:
S0:录入预设的音频资源,并按照特定的规则构建人机互动模型,预设的音频资源为执行阅读指令所进行阅读播放的客体。
本步骤中,预设的音频资源是根据用户需求确定的,比如书籍、故事、儿歌等,只要是用户日常想收听的内容,皆可提前录入;所述按照特定的规则构建人机互动模型,即按照特定的话术建立对话规则,使机器人识别用户特定样本的语音信息,并通过语音信息中的一些关键词判断用户的需求,再通过特定的话术进行反馈对话,避免机器人对用户的语音信息产生误解,让对话更顺畅。
本实施例中,按照特定的规则构建人机互动模型的步骤,包括:
S01:录入需求指令关键词和对应需求指令关键词的需求反馈话术;
S02:识别需求指令关键词的语义;
S03:根据需求指令关键词的语义和需求反馈话术建立匹配关系,以构建人机互动模型。
上述步骤S01中,选择适合各个场景对话的特定的指令关键词和对应需求指令关键词的需求反馈话术,比如关键词包括特定的书名、文章名、歌曲名称以及页数之类的词汇,还包括“收听”、“阅读”、“想”、“要”“不想”、“不要”、“停止”、“开始”、“结束”、“暂停”“换”等等表示肯定、否定或改变需求意愿的词汇。反馈话术包括如前文几个场景的对话中所述的“小朋友,您好,请问你想读哪本书籍?”、“小朋友,您好,请问你想换哪一篇呢?”以及“好的,那我们下次再见。”等等之类的话术,无论是关键词还是需求反馈的话术,应尽量是较人性化的语言,且尽量丰富,以满足用户不同需求场景、不同表达方式以及不同反馈方式的需求,实现人机互动如人和人之间的互动那般自然、有趣。
上述步骤S02中,识别需求指令关键词的语义,在步骤S01中录入需求指令关键词后,这些关键词将被储存在所录入的机器人中,机器人识别对比已录入的关键词,当听过对应关键词的语音信息时,机器人可理解该关键词的意思。
上述步骤S03中,根据已经识别的需求指令关键词的语义和需求反馈话术建立匹配关系,当机器人接收到用户特定关键词的语音信息时,就会以特定的话术回应用户,通过建立特定的对话方式,构建起人机互动的模型。
上述步骤S01到S03,通过确定特定的相关关键词汇,让机器人理解其意思,再通过设定特定的反馈话术,让机器人在和用户互动中,根据识别理解到的用户语音意思,选择使用特定的反馈话术作为回答,实现人机的顺畅互动。
在本实施例中,通过和语音信息匹配的人机互动模型与用户进行会话的步骤,包括:
S21:识别语音信息中的需求指令关键词的语义;
S22:根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术;
S23:通过所确定的需求反馈话术对语音信息进行反馈。
上述步骤S21中,根据预先建立的人机互动模型,对比识别接收到的语音信息的关键词,理解语音信息的语义。
步骤S22中,根据预先建立的人机互动模型中特定的需求信息关键词与需求反馈话术的匹配关系,确定当下所识别到的语音信息中需求指令关键词的语义对应的需求反馈话术,以避免人机互动的过程中出现答非所问的情况。
步骤S23中,通过所确定的需求反馈话术对语音信息进行反馈,实现人机之间的互动对话,在这一步中,是可以无限循环的进行的,只要用户发出语音信息,机器人就会反馈,直到互相达成一致,才会进行下一步骤的执行。通过“接收-识别-反馈......”这样的对话过程实现人机互动交流,实现人机之间的人性化互动,增加用户使用阅读机器人进行阅读的乐趣。
在本实施例中,根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术的步骤S22之前,包括:
S2a:在待机模式下,若语音信息中的需求指令关键词的语义表示为唤醒要求,则从待机模式转为工作模式。
在开始进行阅读播放之前,机器人处于待机模式,当用户第一次呼叫机器人时,比如说“小爱,小爱,准备阅读啦”,机器人就开始被唤醒,即从待机模式转换进入工作模式。唤醒后,用户便可跟机器人进行正常的互动对话。通过工作模式和待机模式的设置,通过该步骤中的唤醒工作,实现便捷式交流,同时,节省了机器人的电耗。
参照图2,在一实施例中,执行和用户的阅读需求相对应的阅读指令的步骤之后,还包括:
S4:若执行的是停止阅读的指令,在执行停止阅读的指令后的预设时间到达后,进入待机模式。
在本步骤中,通过预先设定一个时间段,在阅读停止后的预设时间段内,机器人还处于工作模式下,用户可直接表明自己的具体阅读需求,不需要经过唤醒一步,当超过了预设的时间段,机器人便会转入待机模式,以节省电耗。
在另一实施例中,在识别语音信息中的需求指令关键词的语义的步骤之后,包括:
S24:接收到用户发出的表示立即停止阅读要求的语音信息时,执行停止阅读指令。
本步骤中,机器人接收到用户的明确表示停止阅读的语音信息,直接停止阅读,不再跟用户对话确认。主要适用于正在播放阅读,或者正好结束某一章节的阅读时,用户想结束阅读的场景中。这表示要求停止阅读的语音信息,可以在上述步骤S0中按照特定的规则构建人机互动模型时进行特定的设定,可以指定一定的关键词,比如包含“立即”、“马上”之类词语的要求时,表示要求立即关闭,省去了机器人和用户通过再次互动确认,节省了时间,丰富了人机交流的形式。
参照图3,本发明一实施例中,一种阅读机器人,包括:
接收模块1,用于接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;
互动模块2,用于通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;
执行模块3,用于执行和用户的阅读需求相对应的阅读指令。
通过接收模块1的设置,让机器人具备“听力”,用于接收用户的语音信息,为互动提供基础。所述的阅读需求包括当下首次需要阅读某一篇文章、故事等,也可以是要求结束中断一篇文章的阅读改为要求阅读另一篇文章故事,也可以是停止阅读的需求;所述的符合预设规则的语音信息,是指在机器人中已预先建立了一些人机互动模型,设定了一定的对话规则,按照这些人机互动模型和对话规则发出阅读需求的语音信息,机器人接收并识别到的语音信息符合预先设定规则的语音信息,才能进行下一步的对话。
通过互动模块2实现人机的交流互动。机器人接收到阅读需求的语音信息后,匹配与该阅读需求语音信息对应的人机互动模型,采用的特定的话术反馈给用户,并与用户进行对话,通过对话最终确认用户的收听阅读的需求。
通过执行模块3的设置,使机器人可以根据用户的阅读需求执行相应的阅读指令,根据如开始阅读、改变阅读内容或结束阅读等需求,执行开始阅读、改变阅读内容或结束阅读的指令。
本实施例的机器人,接收到用户的阅读需求语音信息后,通过匹配对应语音信息的人机互动模型与用户进行会话,实现人机的互动,以确定用户的具体阅读需求,增加了用户对收听机器人阅读的乐趣。
参照图4,在本实施例中,阅读机器人还包括:
资源录入模块00,用于录入预设的音频资源,所述预设的音频资源为执行所述阅读指令所进行阅读播放的客体;
模型构建模块01,用于按照特定的规则构建人机互动模型。
通过资源录入模块00的设置,实现预设的音频资源的录入储存。预设的音频资源是根据用户需求确定的,比如书籍、故事、儿歌等,只要是用户日常想收听的内容,皆可提前录入。
通过模型构建模块01的设置,按照特定的规则构建人机互动模型,即按照特定的话术建立对话规则,使机器人识别用户特定样本的语音信息,并通过语音信息中的一些关键词判断用户的需求,再通过特定的话术进行反馈对话,避免机器人对用户的语音信息产生误解,让对话更顺畅。
参照图5,模型构建模块01包括:
话术录入单元011,用于录入需求指令关键词和对应需求指令关键词的需求反馈话术;
话术识别单元012,用于识别需求指令关键词的语义;
互动构建单元013,用于根据需求指令关键词的语义和需求反馈话术建立匹配关系,以构建人机互动模型。
通过话术录入单元011录入需求指令关键词和对应需求指令关键词的需求反馈话术,选择适合各个场景对话的特定的指令关键词和对应需求指令关键词的需求反馈话术,比如关键词首先包括特定的书名、文章名、歌曲名称以及页数之类的词汇,还包括“收听”、“阅读”、“想”、“要”“不想”、“不要”、“停止”、“开始”、“结束”、“暂停”“换”等等表示肯定、否定或改变需求意愿的词汇。反馈话术包括如前文几个场景的对话中所述的“小朋友,您好,请问你想读哪本书籍?”、“小朋友,您好,请问你想换哪一篇呢?”以及“好的,那我们下次再见。”等等之类的话术,无论是关键词还是需求反馈的话术,应尽量是较人性化的语言,且尽量丰富,以满足用户不同需求场景、不同表达方式以及不同反馈方式的需求,实现人机互动如人和人之间的互动那般自然、有趣。
通过话术识别单元012识别需求指令关键词的语义,录入需求指令关键词后,这些关键词将被储存在所录入的机器人中,机器人识别对比已录入的关键词,当听过对应关键词的语音信息时,机器人可理解关键词的意思。
通过互动构建单元013构建人机互动模型,根据已经识别的需求指令关键词的语义和需求反馈话术建立匹配关系,当机器人接收到用户特定关键词的语音信息时,就会以特定的话术回应用户,通过建立特定的对话方式,构建起人机互动的模型。
通过话术录入单元011、话术识别单元012和互动构建单元013的设置,确定特定的相关的关键词汇,让机器人理解其意思,并设定特定的反馈话术,让机器人在和用户互动中,根据识别理解的用户语音意思,选择使用特定的反馈话术作为回答,实现人机的顺畅互动。
参照图6,本实施例中,互动模块2包括:
语音识别单元21,用于识别语音信息中的需求指令关键词的语义;
话术匹配单元22,用于根据人机互动模型确定语音信息中的需求指令关键词的语义对应的需求反馈话术;
语音回应单元23,用于通过所确定的需求反馈话术对语音信息进行反馈。
通过语音识别单元21,根据预先建立的人机互动模型,对比识别接收到的语音信息的关键词,理解语音信息的语义。
通过话术匹配单元22,根据预先建立的人机互动模型中特定的需求信息关键词与需求反馈话术的匹配关系,确定当下所识别到的语音信息中需求指令关键词的语义对应的需求反馈话术,以避免人机互动过程中的答非所问。
通过语音回应单元23的设置,通过所确定的需求反馈话术对语音信息进行反馈,实现人机之间的互动对话,通过接收-识别-反馈的完整对话过程,实现人机互动交流,实现用户和机器人之间的人性化互动,增加用户使用阅读机器人进行阅读的乐趣。
参照图7,本实施例中,互动模块2还包括:
唤醒单元24:用于在待机模式下,若语音信息中的需求指令关键词的语义表示为唤醒要求,则从待机模式转为工作模式。
在开始进行阅读播放之前,机器人处于待机模式,当用户第一次呼叫机器人时,比如说“小爱,小爱,准备阅读啦”,机器人就开始被唤醒,即从待机模式转换进入工作模式。唤醒后,用户便可跟机器人进行正常的互动对话。通过工作模式和待机模式的设置,通过该步骤中的唤醒工作,实现便捷式交流,同时,节省了机器人的电耗。
参照图8,本实施例中,机器人还包括:
待机模块4,用于若执行的是停止阅读的指令,在执行停止阅读的指令后的预设时间到达后,进入待机模式。
通过预先设定时间段,在阅读停止后的预设时间段内,机器人还处于工作模式下,可直接表明自己的具体阅读需求,不需要经过唤醒一步,当超过了预设的时间段,机器人便会转入待机模式,以节省电耗。
参照图9,本实施例中,机器人还包括:
快速停止模块5:用于接收到用户发出的表示立即停止阅读要求的语音信息时,执行停止阅读指令。
通过快速停止模块5的设置,实现便捷停止阅读。机器人接收到用户的明确表示停止阅读的语音信息,直接生成相应的停止阅读指令,并执行停止阅读指令。主要适用于正在播放阅读,或者正好结束某一章节的阅读时,用户想结束阅读的场景中。这表示要求停止阅读的语音信息,可以在模型构建模块01中按照特定的规则构建人机互动模型时进行特定的设定,可以指定一定的关键词,比如包含“立即”、“马上”之类词语的要求时,表示要求立即关闭,省去了机器人和用户通过再次互动确认,节省了时间,丰富了人机交流的形式。
本发明提供的机器人阅读的方法,包括:接收用户发出的语音信息,语音信息为用户根据阅读需求发出的符合预设规则的语音信息;通过和语音信息匹配的人机互动模型与用户进行会话,并从会话中获取出用户的阅读需求;执行和用户的阅读需求相对应的阅读指令。在机器人接收到用户的阅读需求语音信息后,通过和语音信息匹配的人机互动模型与用户进行会话,实现人机的互动,以确定用户的具体阅读需求,增加了用户对收听机器人阅读的乐趣。
本发明提供的机器人,通过互动模块的设置,实现用户和机器人的互动交流,进而确认用户的最终阅读需求;通过执行模块的设置,让机器人执行相应阅读需求指令。通过资源录入模块的设置,根据用户的阅读需求,将想要使用的书籍、故事以及儿歌等音频资源提前录入机器人中,无需通过摄像头扫描书本来进行阅读,减少了机器人摆放位置的限制。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种机器人阅读的方法,其特征在于,包括:
接收用户发出的语音信息,所述语音信息为所述用户根据阅读需求发出的符合预设规则的语音信息;
通过和所述语音信息匹配的人机互动模型与所述用户进行会话,并从所述会话中获取出所述用户的阅读需求;
执行和所述用户的阅读需求相对应的阅读指令。
2.根据权利要求1所述的机器人阅读的方法,其特征在于,所述接收用户发出的语音信息的步骤之前,还包括:
录入预设的音频资源,并按照特定的规则构建所述人机互动模型,所述预设的音频资源为执行所述阅读指令所进行阅读播放的客体。
3.根据权利要求2所述的机器人阅读的方法,其特征在于,所述按照特定的规则构建所述人机互动模型的步骤,包括:
录入需求指令关键词和对应所述需求指令关键词的需求反馈话术;
识别所述需求指令关键词的语义;
根据所述需求指令关键词的语义和所述需求反馈话术建立匹配关系,以构建所述人机互动模型。
4.根据权利要求3所述的机器人阅读的方法,其特征在于,所述通过和所述语音信息匹配的人机互动模型与所述用户进行会话的步骤,包括:
识别所述语音信息中的需求指令关键词的语义;
根据所述人机互动模型确定所述语音信息中的需求指令关键词的语义对应的需求反馈话术;
通过所确定的需求反馈话术对所述语音信息进行反馈。
5.根据权利要求4所述的机器人阅读的方法,其特征在于,所述根据所述人机互动模型确定所述语音信息中的需求指令关键词的语义对应的需求反馈话术的步骤之前,包括:
在待机模式下,若所述语音信息中的需求指令关键词的语义表示为唤醒要求,则从待机模式转为工作模式。
6.一种阅读机器人,其特征在于,包括:
接收模块,用于接收用户发出的语音信息,所述语音信息为所述用户根据阅读需求发出的符合预设规则的语音信息;
互动模块,用于通过和所述语音信息匹配的人机互动模型与所述用户进行会话,并从所述会话中获取出所述用户的阅读需求;
执行模块,用于执行和所述用户的阅读需求相对应的阅读指令。
7.根据权利要求6所述的阅读机器人,其特征在于,所述阅读机器人还包括:
资源录入模块,用于录入预设的音频资源,所述预设的音频资源为执行所述阅读指令所进行阅读播放的客体;
模型构建模块,用于按照特定的规则构建所述人机互动模型。
8.根据权利要求7所述的阅读机器人,其特征在于,所述模型构建模块包括:
话术录入单元,用于录入需求指令关键词和对应所述需求指令关键词的需求反馈话术;
话术识别单元,用于识别所述需求指令关键词的语义;
互动构建单元,用于根据所述需求指令关键词的语义和所述需求反馈话术建立匹配关系,以构建所述人机互动模型。
9.根据权利要求8所述的阅读机器人,其特征在于,所述互动模块包括:
语音识别单元,用于识别所述语音信息中的需求指令关键词的语义;
话术匹配单元,用于根据所述人机互动模型确定所述语音信息中的需求指令关键词的语义对应的需求反馈话术;
语音回应单元,用于通过所确定的需求反馈话术对所述语音信息进行反馈。
10.根据权利要求9所述的阅读机器人,其特征在于,所述互动模块还包括:
唤醒单元:用于在待机模式下,若所述语音信息中的需求指令关键词的的语义表示为唤醒要求,则从待机模式转为工作模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811058514.7A CN109166572A (zh) | 2018-09-11 | 2018-09-11 | 机器人阅读的方法和阅读机器人 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811058514.7A CN109166572A (zh) | 2018-09-11 | 2018-09-11 | 机器人阅读的方法和阅读机器人 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109166572A true CN109166572A (zh) | 2019-01-08 |
Family
ID=64894918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811058514.7A Pending CN109166572A (zh) | 2018-09-11 | 2018-09-11 | 机器人阅读的方法和阅读机器人 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166572A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110087270A (zh) * | 2019-05-15 | 2019-08-02 | 深圳市沃特沃德股份有限公司 | 一种阅读的方法、装置、存储介质和计算机设备 |
CN110460798A (zh) * | 2019-06-26 | 2019-11-15 | 平安科技(深圳)有限公司 | 视频访谈服务处理方法、装置、终端与存储介质 |
CN110561453A (zh) * | 2019-09-16 | 2019-12-13 | 北京觅机科技有限公司 | 一种绘本机器人的引导式陪读方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605468A (zh) * | 2013-11-14 | 2014-02-26 | 武汉虹翼信息有限公司 | 一种电子书籍控制装置及其控制交互方法 |
WO2014189988A1 (en) * | 2013-05-21 | 2014-11-27 | Microsoft Corporation | Method for finding elements in a webpage suitable for use in a voice user interface |
US20170039181A1 (en) * | 2013-07-25 | 2017-02-09 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
CN106598241A (zh) * | 2016-12-06 | 2017-04-26 | 北京光年无限科技有限公司 | 一种用于智能机器人的交互数据处理方法及装置 |
CN107729881A (zh) * | 2017-11-17 | 2018-02-23 | 成都伟嘉斯特科技有限公司 | 一种可语音互动的绘本阅读机器人 |
CN107832433A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 基于对话交互的信息推荐方法、装置、服务器和存储介质 |
CN107977395A (zh) * | 2017-08-01 | 2018-05-01 | 北京物灵智能科技有限公司 | 一种帮助用户阅读并理解电子文章的方法及智能语音助手 |
CN107993659A (zh) * | 2017-11-28 | 2018-05-04 | 上海与德科技有限公司 | 应用于机器人的翻页方法、机器人翻页***及服务器 |
CN108281047A (zh) * | 2018-02-09 | 2018-07-13 | 深圳市小猪班克教育科技有限公司 | 交互式智能故事机及其交互方法 |
-
2018
- 2018-09-11 CN CN201811058514.7A patent/CN109166572A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014189988A1 (en) * | 2013-05-21 | 2014-11-27 | Microsoft Corporation | Method for finding elements in a webpage suitable for use in a voice user interface |
US20170039181A1 (en) * | 2013-07-25 | 2017-02-09 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
CN103605468A (zh) * | 2013-11-14 | 2014-02-26 | 武汉虹翼信息有限公司 | 一种电子书籍控制装置及其控制交互方法 |
CN106598241A (zh) * | 2016-12-06 | 2017-04-26 | 北京光年无限科技有限公司 | 一种用于智能机器人的交互数据处理方法及装置 |
CN107977395A (zh) * | 2017-08-01 | 2018-05-01 | 北京物灵智能科技有限公司 | 一种帮助用户阅读并理解电子文章的方法及智能语音助手 |
CN107832433A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 基于对话交互的信息推荐方法、装置、服务器和存储介质 |
CN107729881A (zh) * | 2017-11-17 | 2018-02-23 | 成都伟嘉斯特科技有限公司 | 一种可语音互动的绘本阅读机器人 |
CN107993659A (zh) * | 2017-11-28 | 2018-05-04 | 上海与德科技有限公司 | 应用于机器人的翻页方法、机器人翻页***及服务器 |
CN108281047A (zh) * | 2018-02-09 | 2018-07-13 | 深圳市小猪班克教育科技有限公司 | 交互式智能故事机及其交互方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110087270A (zh) * | 2019-05-15 | 2019-08-02 | 深圳市沃特沃德股份有限公司 | 一种阅读的方法、装置、存储介质和计算机设备 |
CN110087270B (zh) * | 2019-05-15 | 2021-09-17 | 深圳市沃特沃德信息有限公司 | 一种阅读的方法、装置、存储介质和计算机设备 |
CN110460798A (zh) * | 2019-06-26 | 2019-11-15 | 平安科技(深圳)有限公司 | 视频访谈服务处理方法、装置、终端与存储介质 |
CN110561453A (zh) * | 2019-09-16 | 2019-12-13 | 北京觅机科技有限公司 | 一种绘本机器人的引导式陪读方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11184412B1 (en) | Modifying constraint-based communication sessions | |
JP2019117623A (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
WO2017012511A1 (zh) | 语音控制方法、装置及投影仪设备 | |
TWI535258B (zh) | 語音接聽方法與行動終端裝置 | |
CN107277272A (zh) | 一种基于软件app的蓝牙设备语音交互方法及*** | |
CN109166572A (zh) | 机器人阅读的方法和阅读机器人 | |
CN108737933A (zh) | 一种基于智能音箱的对话方法、装置及电子设备 | |
CN103198831A (zh) | 语音操控方法与移动终端装置 | |
CN107018228B (zh) | 一种语音控制***、语音处理方法及终端设备 | |
WO2020098756A1 (zh) | 一种基于情感的语音交互方法、存储介质及终端设备 | |
JP3000999B1 (ja) | 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体 | |
US11514926B2 (en) | Low power mode for speech capture devices | |
US20220399020A1 (en) | Man-machine dialogue mode switching method | |
CN111881280A (zh) | 一种用于电力行业的智能人机交互***及方法 | |
CN109599111A (zh) | 语音交互方法、装置和存储介质 | |
CN101415257A (zh) | 一种人机对话聊天方法 | |
CN111739541B (zh) | 一种基于语音的会议协助方法及***、存储介质及终端 | |
CN109830232A (zh) | 人机交互方法、装置和存储介质 | |
CN108492826B (zh) | 音频处理方法、装置、智能设备及介质 | |
CN109859762A (zh) | 语音交互方法、装置和存储介质 | |
CN109065050A (zh) | 一种语音控制方法、装置、设备及存储介质 | |
Wallis | A robot in the kitchen | |
CN114822551A (zh) | 一种基于智能耳机的交互方法 | |
JP2000089780A (ja) | 音声認識方法および音声認識装置 | |
US6564185B1 (en) | Continuous speech recognition method and program medium with alternative choice selection to confirm individual words |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190108 |
|
RJ01 | Rejection of invention patent application after publication |