CN105427865A - 基于人工智能的智能机器人的语音控制***以及方法 - Google Patents

基于人工智能的智能机器人的语音控制***以及方法 Download PDF

Info

Publication number
CN105427865A
CN105427865A CN201510741857.3A CN201510741857A CN105427865A CN 105427865 A CN105427865 A CN 105427865A CN 201510741857 A CN201510741857 A CN 201510741857A CN 105427865 A CN105427865 A CN 105427865A
Authority
CN
China
Prior art keywords
intelligent robot
steering order
terminal
user
holographic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510741857.3A
Other languages
English (en)
Inventor
赵升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510741857.3A priority Critical patent/CN105427865A/zh
Publication of CN105427865A publication Critical patent/CN105427865A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/363Image reproducers using image projection screens

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种基于人工智能的智能机器人的语音控制***及方法,其中该***包括:第一终端,用于接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端;3D全息投影装置,用于进行3D全息呈像;与3D全息投影装置相连的第二终端,用于接收第一终端发送的控制指令,并在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令。该***扩大语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高用户的兴趣和培养用户的使用习惯。

Description

基于人工智能的智能机器人的语音控制***以及方法
技术领域
本发明涉及语音技术领域,尤其涉及一种基于人工智能(ArtificialIntelligence,简称:AI)的智能机器人的语音控制***以及控制方法。
背景技术
随着语音技术的快速发展,语音技术已经逐渐应用到人们生活的各个领域中,例如,语音搜索领域、语音控制智能机器人领域等。对于语音搜索来说,搜索引擎一般均支持语音搜索,即根据接收到的用户输入的语音信息进行语音搜索,并将相应的搜索结果提供给用户。
然而,在当代快节奏的生活中,人们很需要身边有一个帮助自己能够便捷生活的私人秘书。例如,在互联网世界中,人们需要有个虚拟形态的智能机器人可以充当自己的私人助理,如可以帮助自己订餐、搜电影、查天气等。虽然现有的虚拟形态的智能机器人可以通过语音方式来实现搜索功能,但是,这种虚拟形态的智能机器人一般存在于终端的搜索引擎中,且只能与用户实现文字类型的交互,如用文字回答用户的问题等,比较呆板、缺乏生气。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的智能机器人的语音控制***。该方法进一步扩大了语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高了用户的兴趣和培养用户的使用习惯,提升了用户体验。
本发明的第二个目的在于提出一种基于人工智能的智能机器人的语音控制方法。
为了实现上述目的,本发明第一方面实施例的基于人工智能的智能机器人的语音控制***,包括:第一终端、3D全息投影装置和第二终端,其中,所述第一终端,用于接收用户输入的语音信息,并根据所述语音信息生成控制指令,并将所述控制指令发送至所述第二终端;所述3D全息投影装置,用于进行3D全息呈像;与所述3D全息投影装置相连的所述第二终端,用于接收所述第一终端发送的控制指令,并在所述控制指令为第一类控制指令时,调取智能机器人,并通过所述3D全息投影装置将所述智能机器人进行3D全息呈像,并在所述控制指令为第二类控制指令时,控制所述3D全息呈像中的所述智能机器人执行所述第二类控制指令。
本发明实施例的基于人工智能的智能机器人的语音控制***,可通过第一终端接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端,第二终端在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令,即利用终端将智能机器人、语音控制和3D全息投影这三个产品相结合,实现了软件和硬件相结合,并通过将虚拟形态的智能机器人进行3D形象化,使得虚拟形态的智能机器人的功能发挥到极致,更加深入人心,并通过对话的形式,将语音搜索的便捷之处展示给用户,进一步扩大了语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高了用户的兴趣和培养用户的使用习惯,提升了用户体验。
为了实现上述目的,本发明第二方面实施例的基于人工智能的智能机器人的语音控制方法,包括:第一终端接收用户输入的语音信息,并根据所述语音信息生成控制指令;第二终端接收所述第一终端发送的控制指令,并在所述控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将所述智能机器人进行3D全息呈像,并在所述控制指令为第二类控制指令时,控制所述3D全息呈像中的所述智能机器人执行所述第二类控制指令。
本发明实施例的基于人工智能的智能机器人的语音控制方法,第一终端接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端,第二终端在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令,即利用终端将智能机器人、语音控制和3D全息投影这三个产品相结合,实现了软件和硬件相结合,并通过将虚拟形态的智能机器人进行3D形象化,使得虚拟形态的智能机器人的功能发挥到极致,更加深入人心,并通过对话的形式,将语音搜索的便捷之处展示给用户,进一步扩大了语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高了用户的兴趣和培养用户的使用习惯,提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的基于人工智能的智能机器人的语音控制***的结构框图;
图2是根据本发明一个实施例的第一终端中具有采集语音功能的应用程序的界面示例图;
图3是根据本发明一个实施例的智能机器人显示在3D全息投影中的效果图;
图4是根据本发明一个实施例的3D全息投影中的智能机器人以文本形式显示信息的效果图;
图5是根据本发明一个实施例的基于人工智能的智能机器人的语音控制方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的智能机器人的语音控制***以及方法。
图1是根据本发明一个实施例的基于人工智能的智能机器人的语音控制***的结构框图。优选地,在本发明的实施例中,该智能机器人的形态可为虚拟形态。也就是说,该智能机器人可以虚拟形态存在于互联网世界中。
如图1所示,该基于人工智能的智能机器人的语音控制***可以包括:第一终端10、3D(3-dimension,三维)全息投影装置20和第二终端30。其中,在本发明的实施例中,该第一终端10、第二终端30可分别是手机、平板电脑、个人数字助理、PC机(PersonalComputer,个人计算机)等具有各种操作***的硬件设备。
具体地,第一终端10可用于接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端30。具体而言,在本发明的实施例中,第一终端10可在接收到用户输入的语音信息之后,根据该语音信息生成用户的用户意图,并根据该用户的用户意图生成对应的控制指令。也就是说,第一终端10在接收到用户输入的语音信息之后,可通过语音识别技术对该语音信息进行语音识别,得到对应的文字信息,之后,可对该文字信息进行分词和/或语义分析,得到用户的用户意图,最后,根据该用户的用户意图生成对应的控制指令。
可选地,第一终端10在通过语音识别技术对语音信息进行语音识别以得到对应的文字信息之后,可根据该文字信息从预设的文字-指令对照库中找到与该文字信息对应的控制指令。
3D全息投影装置20可用于进行3D全息呈像。可以理解,3D全息投影装置20是利用干涉和衍射原理记录并再现物体真实的三维图像,该三维图像无需用户配戴3D眼镜就可以看到其立体的虚拟景象。需要说明的是,本发明对3D全息投影装置20的结构不做具体限定,该3D全息投影装置20可以是市面上具有3D全息投影技术的全息投影仪,还可以是用户制作的投影仪。只要3D全息投影装置20能够实现3D全息投影的功能即可。
第二终端30与3D全息投影装置20相连,第二终端30可用于接收第一终端10发送的控制指令,并在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置20将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令。可选地,在本发明的实施例中,第二终端30可通过接口转换器与3D全息投影装置20相连。
也就是说,第二终端30在接收到第一终端10发送的控制指令之后,可根据该控制指令对该虚拟形态的智能机器人进行相应的控制。例如,当用户输入具有调取智能机器人含义的语音信息时,第一终端10可对该语音信息进行识别,确定该语音信息含有具有调取智能机器人含义的关键词,如“出来吧”、“调取智能机器人”、“全息投影”等,之后可根据该关键词生成相应的第二类控制指令,如调取控制指令等。第二终端30在接收到第一终端10发送的如调取控制指令等第二类控制指令之后,可根据该类控制指令调取出存在于第二终端30中的智能机器人,并通过3D全息投影装置20将该智能机器人进行3D全息呈像,即将存在于第二终端30中的智能机器人在3D全息投影的作用下形成3D类型,如以3D形式显示在用户面前。
其中,在本发明的一个实施例中,第二类控制指令可包括但不限于搜索指令和动作指令等。
在本发明的实施例中,当第二类控制指令为搜索指令时,第二终端30可控制3D全息呈像中的智能机器人根据该搜索指令进行搜索,并控制3D全息呈像中的智能机器人提供相应的搜索结果。也就是说,当用户想进行语音搜索时,可通过第一终端10进行语音输入,第一终端10在接收到用户输入的语音信息之后,可根据该语音信息确定用户的用户意图为搜索,此时根据该用户意图生成对应的搜索指令并发送至第二终端30。第二终端30在接收到该搜索指令之后,可将该搜索指令发送至3D全息呈像中的智能机器人,该3D全息呈像中的智能机器人根据该搜索指令进行搜索,并将相应的搜索结果提供给用户,可选地,该3D全息呈像中的智能机器人可通过语音方式将该搜索结果提供给用户,还可通过文本、图片等形式将该搜索结果提供给用户。
当第二类控制指令为动作指令时,第二终端30可控制3D全息呈像中的智能机器人根据该动作指令执行相应的动作。也就是说,当用户想与3D全息呈像中的智能机器人进行动作互动时,可通过第一终端10进行语音输入,第一终端10在接收到用户输入的语音信息之后,可根据该语音信息确定用户的用户意图为让3D全息呈像中的智能机器人做动作,如跳舞动作、表情动作(如生气、高兴、激动等)等,此时根据该用户意图生成对应的动作指令并发送到第二终端30。第二终端30在接收到该动作指令之后,可将该动作指令发送到3D全息呈像中的智能机器人,该3D全息呈像中的智能机器人根据该动作指令执行相应的动作。
为了使得本领域的技术人员能够更加清楚地了解本发明,下面将举例说明。
举例而言,假设第一终端、第二终端分别为智能手机1、智能手机2,该智能手机1、智能手机2的操作***分别为IOS操作***(苹果公司开发的移动操作***),且智能手机1中具有采集用户语音、且将该语音生成对应的控制指令功能的应用程序,智能手机2中具有全息演示功能的应用程序,该应用程序可由HTML5页面组成,该HTML5页面中可嵌入至少一个动画,该动画可为虚拟形态的智能机器人。首先,可将智能手机2与3D全息投影装置通过接口转换器进行连接。之后,用户可通过智能手机1将存在于智能手机2中智能机器人调取出来,如用户可打开智能手机1中的具有采集用户语音、且将该语音生成对应的控制指令功能的应用程序,如图2所示,用户可按住该应用程序中的话筒按钮并输入语音“出来吧”,智能手机1在检测到用户完成语音输入之后,可根据该语音生成对应的调取控制指令并将其发送到智能手机2。智能手机2在接收到智能手机1发送的调取控制指令之后,可将通过智能手机2中的应用程序将虚拟形态的智能机器人调取出来,并可通过3D全息投影装置将该智能机器人进行3D全息呈像,如图3所示,3D全息投影装置可在3D全息投影的作用下,将存在于智能手机2中的虚拟形态的智能机器人以3D全息成像方式展现在用户面前。可以理解,3D全息投影中的智能机器人可以通过语音形式和/或文本形式进行自我介绍。
当用户想通过智能手机1中的应用程序对3D全息投影中的智能机器人进行控制时,可通过智能手机1中的应用程序输入语音信息,如搜索类型的语音、动作类型(如让智能机器人做跳舞、高兴、生气等动作)的语音等。智能手机1在接收到这些语音之后,可根据该语音确定用户的用户意图,并根据该用户意图生成对应的控制指令并发送到智能手机2。智能手机2将该对应的控制指令发送到3D全息投影中的智能机器人,3D全息投影中的智能机器人根据这些控制指令进行相应的操作。例如,当3D全息投影中的智能机器人进行搜索时,可将相应的搜索结果通过语音形式和/或文本形式提供给用户。如图4所示,3D全息投影中的智能机器人通过文本形式将相应的信息提供给了用户。由此,可以实现3D全息投影中的智能机器人与用户进行聊天、跳舞等互动功能。
本发明实施例的基于人工智能的智能机器人的语音控制***,可通过第一终端接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端,第二终端在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令,即利用终端将智能机器人、语音控制和3D全息投影这三个产品相结合,实现了软件和硬件相结合,并通过将虚拟形态的智能机器人进行3D形象化,使得虚拟形态的智能机器人的功能发挥到极致,更加深入人心,并通过对话的形式,将语音搜索的便捷之处展示给用户,进一步扩大了语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高了用户的兴趣和培养用户的使用习惯,提升了用户体验。
为了实现上述实施例,本发明还提出了一种基于人工智能的智能机器人的语音控制方法。
图5是根据本发明一个实施例的基于人工智能的智能机器人的语音控制方法的流程图。优选地,在本发明的实施例中,该智能机器人的形态可为虚拟形态。也就是说,该智能机器人可以虚拟形态存在于互联网世界中。
如图5所示,该基于人工智能的智能机器人的语音控制方法可以包括:
S510,第一终端接收用户输入的语音信息,并根据语音信息生成控制指令。
其中,在本发明的实施例中,该第一终端可以是手机、平板电脑、个人数字助理、PC机等具有各种操作***的硬件设备。
具体而言,在本发明的实施例中,第一终端在接收到用户输入的语音信息之后,可根据该语音信息生成用户的用户意图,并根据该用户的用户意图生成对应的控制指令。也就是说,第一终端在接收到用户输入的语音信息之后,可通过语音识别技术对该语音信息进行语音识别,得到对应的文字信息,之后,可对该文字信息进行分词和/或语义分析,得到用户的用户意图,最后,根据该用户的用户意图生成对应的控制指令。
可选地,第一终端在通过语音识别技术对语音信息进行语音识别以得到对应的文字信息之后,可根据该文字信息从预设的文字-指令对照库中找到与该文字信息对应的控制指令。
S520,第二终端接收第一终端发送的控制指令,并在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令。
可选地,在本发明的实施例中,第二终端可通过接口转换器与3D全息投影装置相连。
其中,在本发明的实施例中,3D全息投影装置可用于进行3D全息呈像。可以理解,3D全息投影装置是利用干涉和衍射原理记录并再现物体真实的三维图像,该三维图像无需用户配戴3D眼镜就可以看到其立体的虚拟景象。需要说明的是,本发明对3D全息投影装置的结构不做具体限定,该3D全息投影装置可以是市面上具有3D全息投影技术的全息投影仪,还可以是用户制作的投影仪。只要3D全息投影装置能够实现3D全息投影的功能即可。
也就是说,第二终端在接收到第一终端发送的控制指令之后,可根据该控制指令对该虚拟形态的智能机器人进行相应的控制。例如,当用户输入具有调取智能机器人含义的语音信息时,第一终端可对该语音信息进行识别,确定该语音信息含有具有调取智能机器人含义的关键词,如“出来吧”、“调取智能机器人”、“全息投影”等,之后可根据该关键词生成相应的第二类控制指令,如调取控制指令等。第二终端在接收到第一终端发送的如调取控制指令等第二类控制指令之后,可根据该类控制指令调取出存在于第二终端中的智能机器人,并通过3D全息投影装置将该智能机器人进行3D全息呈像,即将存在于第二终端中的智能机器人在3D全息投影的作用下形成3D类型,如以3D形式显示在用户面前。
其中,在本发明的一个实施例中,该第二类控制指令可包括但不限于搜索指令和动作指令等。
在本发明的实施例中,当第二类控制指令为搜索指令时,第二终端可控制3D全息呈像中的智能机器人根据搜索指令进行搜索,并控制3D全息呈像中的智能机器人提供相应的搜索结果。也就是说,当用户想进行语音搜索时,可通过第一终端进行语音输入,第一终端在接收到用户输入的语音信息之后,可根据该语音信息确定用户的用户意图为搜索,此时根据该用户意图生成对应的搜索指令并发送至第二终端。第二终端在接收到该搜索指令之后,可将该搜索指令发送至3D全息呈像中的智能机器人,该3D全息呈像中的智能机器人根据该搜索指令进行搜索,并将相应的搜索结果提供给用户,可选地,该3D全息呈像中的智能机器人可通过语音方式将该搜索结果提供给用户,还可通过文本、图片等形式将该搜索结果提供给用户。
当第二类控制指令为动作指令时,第二终端可控制3D全息呈像中的智能机器人根据动作指令执行相应的动作。也就是说,当用户想与3D全息呈像中的智能机器人进行动作互动时,可通过第一终端进行语音输入,第一终端在接收到用户输入的语音信息之后,可根据该语音信息确定用户的用户意图为让3D全息呈像中的智能机器人做动作,如跳舞动作、表情动作(如生气、高兴、激动等)等,此时根据该用户意图生成对应的动作指令并发送到第二终端。第二终端在接收到该动作指令之后,可将该动作指令发送到3D全息呈像中的智能机器人,该3D全息呈像中的智能机器人根据该动作指令执行相应的动作。
为了使得本领域的技术人员能够更加清楚地了解本发明,技术人员可参照上述***实施例对应的图2至图4的详细描述,在此不再赘述。
本发明实施例的基于人工智能的智能机器人的语音控制方法,第一终端接收用户输入的语音信息,并根据语音信息生成控制指令,并将控制指令发送至第二终端,第二终端在控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将智能机器人进行3D全息呈像,并在控制指令为第二类控制指令时,控制3D全息呈像中的智能机器人执行第二类控制指令,即利用终端将智能机器人、语音控制和3D全息投影这三个产品相结合,实现了软件和硬件相结合,并通过将虚拟形态的智能机器人进行3D形象化,使得虚拟形态的智能机器人的功能发挥到极致,更加深入人心,并通过对话的形式,将语音搜索的便捷之处展示给用户,进一步扩大了语音搜索和智能机器人的影响范围和宣传力度,并将语音搜素和智能机器人更加形象地展现在用户面前,提高了用户的兴趣和培养用户的使用习惯,提升了用户体验。
综上,可以看出,本发明利用两个终端的目的就是实现一个终端来控制另一个终端中智能机器人的操作,并通过3D全息投影技术将该智能机器人投影到3D全息中,并通过上述一个终端通过语音指导该3D全息中的智能机器人完成相应的任务。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于人工智能的智能机器人的语音控制***,其特征在于,包括:第一终端、3D全息投影装置和第二终端,其中,
所述第一终端,用于接收用户输入的语音信息,并根据所述语音信息生成控制指令,并将所述控制指令发送至所述第二终端;
所述3D全息投影装置,用于进行3D全息呈像;
与所述3D全息投影装置相连的所述第二终端,用于接收所述第一终端发送的控制指令,并在所述控制指令为第一类控制指令时,调取智能机器人,并通过所述3D全息投影装置将所述智能机器人进行3D全息呈像,并在所述控制指令为第二类控制指令时,控制所述3D全息呈像中的所述智能机器人执行所述第二类控制指令。
2.如权利要求1所述的基于人工智能的智能机器人的语音控制***,其特征在于,所述第一终端在接收到用户输入的语音信息之后,根据所述语音信息生成所述用户的用户意图,并根据所述用户的用户意图生成对应的控制指令。
3.如权利要求1所述的基于人工智能的智能机器人的语音控制***,其特征在于,所述第二类控制指令包括搜索指令和动作指令。
4.如权利要求3所述的基于人工智能的智能机器人的语音控制***,其特征在于,
当所述第二类控制指令为所述搜索指令时,所述第二终端控制所述3D全息呈像中的所述智能机器人根据所述搜索指令进行搜索,并控制所述3D全息呈像中的所述智能机器人提供相应的搜索结果;
当所述第二类控制指令为所述动作指令时,所述第二终端控制所述3D全息呈像中的所述智能机器人根据所述动作指令执行相应的动作。
5.如权利要求1至4中任一项所述的基于人工智能的智能机器人的语音控制***,其特征在于,所述第二终端通过接口转换器与所述3D全息投影装置相连。
6.一种基于人工智能的智能机器人的语音控制方法,其特征在于,包括:
第一终端接收用户输入的语音信息,并根据所述语音信息生成控制指令;
第二终端接收所述第一终端发送的控制指令,并在所述控制指令为第一类控制指令时,调取智能机器人,并通过3D全息投影装置将所述智能机器人进行3D全息呈像,并在所述控制指令为第二类控制指令时,控制所述3D全息呈像中的所述智能机器人执行所述第二类控制指令。
7.如权利要求6所述的基于人工智能的智能机器人的语音控制方法,其特征在于,根据所述语音信息生成控制指令,具体包括:
根据所述语音信息生成所述用户的用户意图;
根据所述用户的用户意图生成对应的控制指令。
8.如权利要求6所述的基于人工智能的智能机器人的语音控制方法,其特征在于,所述第二类控制指令包括搜索指令和动作指令。
9.如权利要求8所述的基于人工智能的智能机器人的语音控制方法,其特征在于,
当所述第二类控制指令为所述搜索指令时,所述第二终端控制所述3D全息呈像中的所述智能机器人根据所述搜索指令进行搜索,并控制所述3D全息呈像中的所述智能机器人提供相应的搜索结果;
当所述第二类控制指令为所述动作指令时,所述第二终端控制所述3D全息呈像中的所述智能机器人根据所述动作指令执行相应的动作。
10.如权利要求6至9中任一项所述的基于人工智能的智能机器人的语音控制方法,其特征在于,所述第二终端通过接口转换器与所述3D全息投影装置相连。
CN201510741857.3A 2015-11-04 2015-11-04 基于人工智能的智能机器人的语音控制***以及方法 Pending CN105427865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510741857.3A CN105427865A (zh) 2015-11-04 2015-11-04 基于人工智能的智能机器人的语音控制***以及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510741857.3A CN105427865A (zh) 2015-11-04 2015-11-04 基于人工智能的智能机器人的语音控制***以及方法

Publications (1)

Publication Number Publication Date
CN105427865A true CN105427865A (zh) 2016-03-23

Family

ID=55506020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510741857.3A Pending CN105427865A (zh) 2015-11-04 2015-11-04 基于人工智能的智能机器人的语音控制***以及方法

Country Status (1)

Country Link
CN (1) CN105427865A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446953A (zh) * 2015-11-10 2016-03-30 深圳狗尾草智能科技有限公司 一种智能机器人与虚拟3d的交互***及方法
CN106028008A (zh) * 2016-05-26 2016-10-12 邵鑫 机器人的视频投影播放***
CN106462257A (zh) * 2016-07-07 2017-02-22 深圳狗尾草智能科技有限公司 实时互动动画的全息投影***、方法及人工智能机器人
CN106648074A (zh) * 2016-11-25 2017-05-10 合肥优智领英智能科技有限公司 一种智能机器人的人机交互方法
CN106775557A (zh) * 2016-11-28 2017-05-31 墨宝股份有限公司 一种智能机器人与虚拟3d的交互***及方法
CN106959839A (zh) * 2017-03-22 2017-07-18 北京光年无限科技有限公司 一种人机交互装置及方法
CN107351082A (zh) * 2017-07-26 2017-11-17 佛山伊贝尔科技有限公司 一种人机对话全息机器人
WO2018006370A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 一种虚拟3d机器人的交互方法、***及机器人
CN107734166A (zh) * 2017-10-11 2018-02-23 上海展扬通信技术有限公司 一种基于智能终端的控制方法及控制***
CN108322794A (zh) * 2018-03-26 2018-07-24 青岛里奥机器人技术有限公司 机器人全息3d影像展示方法
WO2018148879A1 (zh) * 2017-02-15 2018-08-23 深圳市前海中康汇融信息技术有限公司 全息投影式智能机器人及其控制方法
CN111546307A (zh) * 2020-05-01 2020-08-18 陈宏明 一种具有3d全息投影功能的智能机器人

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1646969A (zh) * 2002-11-16 2005-07-27 罗伯特-博希股份公司 汽车驾驶室内的物像投影装置
CN103927091A (zh) * 2013-01-15 2014-07-16 华为终端有限公司 一种人机交互的方法、装置及***
US20140267599A1 (en) * 2013-03-14 2014-09-18 360Brandvision, Inc. User interaction with a holographic poster via a secondary mobile device
US9070247B2 (en) * 2008-11-11 2015-06-30 Digideal Corporation Automated virtual assistant
CN104898581A (zh) * 2014-03-05 2015-09-09 青岛海尔机器人有限公司 一种全息智能中控***
CN104985599A (zh) * 2015-07-20 2015-10-21 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人控制方法、***及智能机器人
CN105009039A (zh) * 2012-11-30 2015-10-28 微软技术许可有限责任公司 使用imu的直接全息图操纵

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1646969A (zh) * 2002-11-16 2005-07-27 罗伯特-博希股份公司 汽车驾驶室内的物像投影装置
US9070247B2 (en) * 2008-11-11 2015-06-30 Digideal Corporation Automated virtual assistant
CN105009039A (zh) * 2012-11-30 2015-10-28 微软技术许可有限责任公司 使用imu的直接全息图操纵
CN103927091A (zh) * 2013-01-15 2014-07-16 华为终端有限公司 一种人机交互的方法、装置及***
US20140267599A1 (en) * 2013-03-14 2014-09-18 360Brandvision, Inc. User interaction with a holographic poster via a secondary mobile device
CN104898581A (zh) * 2014-03-05 2015-09-09 青岛海尔机器人有限公司 一种全息智能中控***
CN104985599A (zh) * 2015-07-20 2015-10-21 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人控制方法、***及智能机器人

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯东阳: "《文化营销攻心术》", 30 November 2014, 经济日报出版社 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446953A (zh) * 2015-11-10 2016-03-30 深圳狗尾草智能科技有限公司 一种智能机器人与虚拟3d的交互***及方法
CN106028008A (zh) * 2016-05-26 2016-10-12 邵鑫 机器人的视频投影播放***
CN106462257A (zh) * 2016-07-07 2017-02-22 深圳狗尾草智能科技有限公司 实时互动动画的全息投影***、方法及人工智能机器人
WO2018006370A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 一种虚拟3d机器人的交互方法、***及机器人
CN106648074A (zh) * 2016-11-25 2017-05-10 合肥优智领英智能科技有限公司 一种智能机器人的人机交互方法
CN106775557A (zh) * 2016-11-28 2017-05-31 墨宝股份有限公司 一种智能机器人与虚拟3d的交互***及方法
WO2018148879A1 (zh) * 2017-02-15 2018-08-23 深圳市前海中康汇融信息技术有限公司 全息投影式智能机器人及其控制方法
CN106959839A (zh) * 2017-03-22 2017-07-18 北京光年无限科技有限公司 一种人机交互装置及方法
CN107351082A (zh) * 2017-07-26 2017-11-17 佛山伊贝尔科技有限公司 一种人机对话全息机器人
CN107734166A (zh) * 2017-10-11 2018-02-23 上海展扬通信技术有限公司 一种基于智能终端的控制方法及控制***
CN108322794A (zh) * 2018-03-26 2018-07-24 青岛里奥机器人技术有限公司 机器人全息3d影像展示方法
CN108322794B (zh) * 2018-03-26 2020-12-15 临沂文衡信息技术有限公司 机器人全息3d影像展示方法
CN111546307A (zh) * 2020-05-01 2020-08-18 陈宏明 一种具有3d全息投影功能的智能机器人

Similar Documents

Publication Publication Date Title
CN105427865A (zh) 基于人工智能的智能机器人的语音控制***以及方法
KR20210110620A (ko) 상호작용 방법, 장치, 전자 장치 및 저장 매체
KR102444712B1 (ko) 다중-모달리티 특징 융합을 통한 퍼스널 미디어 자동 재창작 시스템 및 그 동작 방법
CN105224278A (zh) 语音交互服务处理方法及装置
US9805493B2 (en) Social identity models for automated entity interactions
CN105228013A (zh) 弹幕信息处理方法、装置及弹幕视频播放器
Chang et al. The prompt artists
WO2006111374A2 (en) Software cinema
CN114419205B (zh) 虚拟数字人的驱动方法及位姿获取模型的训练方法
KR20210001859A (ko) 3차원 가상 인물 입모양 변화 제어 방법 및 장치
CN111428520A (zh) 一种文本翻译方法及装置
CN108257205B (zh) 一种三维模型构建方法、装置及***
CN105491126A (zh) 基于人工智能的服务提供方法及装置
CN112819933A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN110347817A (zh) 智能应答方法及装置、存储介质、电子设备
Stemasov et al. The road to ubiquitous personal fabrication: Modeling-free instead of increasingly simple
CN115497448A (zh) 语音动画的合成方法、装置、电子设备及存储介质
US10922867B2 (en) System and method for rendering of an animated avatar
Origlia et al. FANTASIA: a framework for advanced natural tools and applications in social, interactive approaches
CN109471580A (zh) 一种可视化3d课件编辑器及课件编辑方法
Ding et al. Enhance Image-to-Image Generation with LLaVA Prompt and Negative Prompt
CN116737883A (zh) 人机交互方法、装置、设备及存储介质
Spranger et al. Open-ended grounded semantics
CN116127003A (zh) 文本处理方法、装置、电子设备及存储介质
Celentano et al. Evaluating metaphor reification in tangible interfaces

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323