CN108172221A - 基于智能终端的操控飞行器的方法和装置 - Google Patents

基于智能终端的操控飞行器的方法和装置 Download PDF

Info

Publication number
CN108172221A
CN108172221A CN201611115955.7A CN201611115955A CN108172221A CN 108172221 A CN108172221 A CN 108172221A CN 201611115955 A CN201611115955 A CN 201611115955A CN 108172221 A CN108172221 A CN 108172221A
Authority
CN
China
Prior art keywords
voice
control
effective control
intelligent terminal
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611115955.7A
Other languages
English (en)
Inventor
胡华智
郭尚进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ehang Intelligent Technology Co Ltd
Original Assignee
Guangzhou Ehang Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ehang Intelligent Technology Co Ltd filed Critical Guangzhou Ehang Intelligent Technology Co Ltd
Priority to CN201611115955.7A priority Critical patent/CN108172221A/zh
Publication of CN108172221A publication Critical patent/CN108172221A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/20Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)

Abstract

本发明涉及基于智能终端的操控飞行器的方法和装置。所述方法包括:获取用户语音,识别所述语音中包含的有效控制语音;根据所述有效控制语音生成对应的飞行器的控制指令;向飞行器发送所述控制指令。本发明进一步简化了用户操控飞行器的方式,并有利于提高飞行器操控的灵活度。

Description

基于智能终端的操控飞行器的方法和装置
技术领域
本发明涉及无人机技术领域,特别是涉及基于智能终端的操控飞行器的方法和基于智能终端的操控飞行器的装置。
背景技术
传统的无人机需要通过专用的遥控器进行操控,操控技巧性和复杂度均较高,通常只有专业的玩家才能有效操控;近年来,随着无人机的推广和普及,无人机的操控方式也得以较大的简化,即使是非专业的玩家也可以通过手机、平板等日常的智能终端上的预装软件进行无人机操控。然而即便如此,预装软件界面上的多级操控菜单和若干功能不同的控件选项,对于初级玩家来说依然是个难题。
此外,无论是传统遥控器的方式,还是近年来的智能终端操控方式,玩家在操控过程中均需不时查看操控设备上相应的菜单或者控件,以向无人机发出相应的指令,这不利于玩家实时观察无人机的飞行状况;特别是玩家戴着VR眼镜、头套等穿戴设备进行沉浸式体验过程中,还需先取下穿戴设备才能查看操控设备上相应的菜单或者控件,对玩家来说非常不方便。
发明内容
基于此,本发明实施例提供了一种基于智能终端的操控飞行器的方法和装置,能够进一步简化用户操控飞行器的方式,并有利于提高飞行器操控的灵活度。
本发明一方面提供基于智能终端的操控飞行器的方法,包括:
获取用户语音,识别所述语音中包含的有效控制语音;
根据所述有效控制语音生成对应的飞行器的控制指令;
向飞行器发送所述控制指令。
本发明另一方面提供一种基于智能终端的操控飞行器的装置,包括:
语音监测模块,用于获取用户语音,识别所述语音中包含的有效控制语音;
指令生成模块,用于根据所述有效控制语音生成对应的飞行器的控制指令;
指令发送模块,用于向飞行器发送所述控制指令。
上述技术方案,通过实时获取周围环境中的用户语音,识别所述语音中包含的有效控制语音,并根据所述有效控制语音生成对应的飞行器的控制指令,向飞行器发送所述控制指令;对用户来说,无需操作复杂的控制菜单或者功能选项,通过遵循直觉的语音控制模式便可轻松控制飞行器实现各种飞行动作,简化了用户操控飞行器的方式,降低用户的学习成本,并且有利于提高飞行器操控的灵活度。
附图说明
图1为一实施例的本发明方案的硬件环境示意图;
图2为一实施例的基于智能终端的操控飞行器的方法的示意性流程图;
图3为另一实施例的基于智能终端的操控飞行器的方法的示意性流程图;
图4为另一实施例的基于智能终端的操控飞行器的方法的示意性流程图;
图5为一实施例的基于智能终端的操控飞行器的装置的示意性结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为实现本发明实施例基于智能终端的操控飞行器的方法的硬件环境示意图;实现本发明实施例的基于智能终端的操控飞行器的方法的硬件环境为这样的智能终端:至少包括通过***总线连接的处理器、语音采集模组、语音识别模组、通信模组、电源接口和存储介质。其中,语音采集模组用于监测周围环境中的语音信号;语音识别模组用于将模拟的语音信号识别为对应的数字信号,以识别语音信号对应的语义信息;所述通信模组用于建立与飞行器的通信连接;电源接口用于与外部电源连接,外部电源通过该电源接口向智能终端电池供电;所述存储介质中至少存储有操作***、数据库以及一种操控飞行器的装置,该装置可用于实现本发明实施例的基于智能终端的操控飞行器的方法。所述智能终端可以为手机、平板电脑等,也可以是其他具有上述结构的设备。
结合图1及上述对硬件环境的说明,以下对基于智能终端的操控飞行器的方法的实施例进行说明。
图2为一实施例的基于智能终端的操控飞行器的方法的示意性流程图;本实施例中,以将该方法应用在智能终端为例进行说明,所述智能终端包括但不限于智能手机、平板等终端。如图2所示,本实施例中的基于智能终端的操控飞行器的方法包括步骤:
S11,获取用户语音,识别所述语音中包含的有效控制语音;
可通过智能终端的语音采集模组获取周围环境中的用户语音,所述语音采集模组指的是能够感知并采集语音信号的装置,包括但不限于麦克风、声音传感器等。
一方面,由于用户在操控飞行器时发出语音并非全是用于控制飞行器的语音,例如只是与身边的其他用户交谈,或者只是自言自语,因此需要对用户在操控飞行器时发出语音进行识别,得到有效控制语音。在一优选实施方式中,可根据预设的语音控制库识别所述语音中包含的有效控制语音;语音控制库中包含预置的若干控制关键字,所述控制关键字既可以是数字信号形式的关键字,也可以模拟信号形式的语音关键字;因此通过这样的语音控制库可识别获取到的当前语音中是否包含了有效控制语音。
另一方面,用户在操控飞行器时,附近的其他用户可能会发出语音,为了防止误操作,还需对获取到的语音进行区分,以得到有效控制语音。在一优选实施方式中,可根据语音对应的音色信息识别所述语音中包含的有效控制语音。例如预先将授权用户的声音存储在***中,由于不同人的音色是唯一的,因此可通过音色比对排除获取到的无效语音。
此外,通常获取到的操作用户的语音一般较强,附近其他用户的语音较弱,因此在一优选实施方式中,还可根据语音的声强信息识别所述语音中包含的有效控制语音。例如,预设一个声强阈值,只有获取到的语音的声强大于等于该声强阈值时,才能作为有效控制语音,低于该声强阈值的语音,则视为无效语音,进而排除无效语音的干扰。即检测所述语音的声强,若所述声强大于等于预设的声强阈值,则将所述语音识别为有效控制语音。
S12,根据所述有效控制语音生成对应的飞行器的控制指令;
在一优选实施方式中,可先识别有效控制语音对应的语义信息,根据所述语义信息生成对应的飞行器的控制指令,例如若有效控制语音为“控制飞行器拉左”,则生成一条拉左指令;或者例如若有效控制语音为“8点整执行拉左”,则生成一条带执行条件的拉左指令,该指令的具体内容可为“检测当前时间是否到达8点,若是,拉左”;又或者如,若有效控制语音为“电池电量低于10%时下降”,则生成一条带条件的下降指令,指令的具体内容为“检测电池电量低于10%,若是,下降”。
S13,向飞行器发送所述控制指令。
向飞行器发送所述控制指令的方式包括但不限于基于预设的中继器发送,以实现超视距的操作。
在一优选实施方式中,为了提高操作的灵敏度,生成控制指令之后立即向飞行器发送所述控制指令。
在某些情况下,飞行器可能无法执行相应的控制指令,例如:对于起飞指令,若当前飞行器尚未解锁,则无法执行该条指令。为了提醒用户,在一优选实施方式中,飞行器收到控制指令后,将返回其对所述控制指令的执行情况,包括执行成功、执行失败以及失败原因等信息,在收到飞行器返回的对所述控制指令的执行信息之后,通过语音的方式播报所述执行信息,实现了人机对讲的效果,提示用户发出正确的控制语音。
通过本实施例的基于智能终端的操控飞行器的方法,对用户来说,无需操作复杂的控制菜单或者功能选项,通过遵循直觉的语音控制模式便可轻松控制飞行器实现各种飞行动作,简化了用户操控飞行器的方式,降低用户的学习成本,并且有利于提高飞行器操控的灵活度。
下面结合图3,对本发明基于智能终端的操控飞行器的方法作进一步的说明。本实施例中,结合声强和语音控制库识别有效控制语音。如图3所示,本实施例的基于智能终端的操控飞行器的方法包括步骤:
S301,获取用户语音;
S302,根据所述语音的声强信息识别所述语音中包含的有效控制语音;
在一优选实施方式中,若所述语音中仅有一个用户的语音,则检测所述语音的声强是否大于等于设定声强阈值,若是,则将所述语音识别为有效控制语音,执行下一步骤,若否,忽略所述语音。所述声强阈值可根据实际情况进行设定,本实施例对此不做限定。
在另一优选实施方式中,若所述语音中包含两个以上用户的语音,则提取声强最大的用户的语音作为有效控制语音,忽略其他用户的语音,执行下一步骤。
在另一优选实施方式中,若所述语音中包含两个以上用户的语音,则分别检测各用户语音的声强是否大于等于设定声强阈值,提取声强大于等于设定声强阈值的用户的语音作为有效控制语音,忽略声强小于设定声强阈值的用户的语音。
S303,根据预设的语音控制库进一步识别步骤302得到的语音中包含的有效控制语音。
在一优选实施方式中,可先识别经过上述步骤得到的语音的语义信息,检测所述语义信息是否与预设语音控制库中的至少一个控制关键字匹配;若是,则将所述语音识别为有效控制语音,执行下一步骤,否则,忽略所述语音。
S304,根据所述有效控制语音生成对应的飞行器的控制指令;
S305,向飞行器发送所述控制指令。
本实施例中,获取到周围环境中的语音之后,首先根据语音的声强信息进行第一次识别,进一步的,再根据预设的语音控制库进行第二次识别,由此可准确有效的得到有效控制语音,避免干扰语音导致的误操作。可以理解的是,也可以先根据预设的语音控制库进行第一次识别,再根据语音的声强信息进行第二次识别。
下面结合图4,对本发明基于智能终端的操控飞行器的方法作进一步的说明。本实施例中,在上一实施例的基础上,还根据音色对语音进行识别。如图4所示,本实施例的基于智能终端的操控飞行器的方法包括步骤:
S401,获取用户语音;
S402,根据所述语音的声强信息识别所述语音中包含的有效控制语音;
在一优选实施方式中,若所述语音中仅有一个用户的语音,则检测所述语音的声强是否大于等于设定声强阈值,若是,则将所述语音识别为有效控制语音,执行下一步骤,若否,忽略所述语音。所述声强阈值可根据实际情况进行设定,本实施例对此不做限定。
在另一优选实施方式中,若所述语音中包含两个以上用户的语音,则检测所述语音的最大的声强,将声强最大的用户的语音作为有效控制语音,剔除其他用户的语音,执行下一步骤。
在另一优选实施方式中,若所述语音中包含两个以上用户的语音,则分别检测各用户语音的声强是否大于等于设定声强阈值,将声强大于等于设定声强阈值的用户的语音作为有效控制语音,将声强小于设定声强阈值的语音用户的语音作为无效语音,剔除无效语音。
S403,根据语音对应的音色信息进一步识别步骤S402得到的语音中包含的有效控制语音。
在一优选实施方式中,步骤S403的实施方式可为:识别所述语音的音色,根据预设的授权用户的语音音色判断所述语音是否来自授权用户;若是,将所述语音识别为有效控制语音。该方式适应于只有一个用户语音的场景。
在另一优选实施方式中,步骤S403的实施方式可为:识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若所述语音中包含来自授权用户的语音成分,则提取所述语音中来自授权用户的语音成分,得到有效控制语音。该方式适应于有两个以上用户语音的场景。
在另一优选实施方式中,步骤S403的实施方式可为:识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若预设的授权用户为两个以上、且判断得出所述语音成分来自两个以上的授权用户,则获取所述语音成分对应的授权用户中优先级最高(或者语音声强最大)的授权用户,作为第一授权用户;提取所述语音中来自第一授权用户的语音成分,得到有效的控制语音。该方式适应于有两个以上授权用户的语音的场景,可进一步避免其他用户语音的干扰。
S404,根据预设的语音控制库进一步识别步骤S403得到的语音中包含的有效控制语音。
在一优选实施方式中,可先识别经过上述步骤得到的语音的语义信息,检测所述语义信息是否与预设语音控制库中的至少一个控制关键字匹配;若是,则将所述语音识别为有效控制语音,执行下一步骤,否则,忽略所述语音。
在一优选实施方式中,所述语音控制库中的控制关键字包括:起飞、悬停、环绕、拉远、跟随、升高、降低、前进、后退、拉左、拉右、调整飞行参数、调整相机参数、拍照、开始录像、停止录像中至少两种。控制语音控制库中的控制关键字的有限数量,是考虑到自然语言识别实现的技术难度,并且当用户能使用的词汇被限制,***的语音识别速度更快、准确度也更高。
S405,根据所述有效控制语音生成对应的飞行器的控制指令;
本实施例中,若上述步骤之后,确定所述语音中不存在有效控制语音,忽略所述语音,不会生成对应的飞行器的控制指令。
S406,向飞行器发送所述控制指令。
飞行器收到所述控制指令后,便可根据所述控制指令执行相应的动作,例如拉左飞行、加速飞行等。此外,飞行器还可将其对控制指令的执行情况返回给智能终端,便于用户知晓飞行器是否成功执行了相应的控制指令。
S407,接收飞行器返回的对所述控制指令的执行信息,语音播报所述执行信息。以无人机为例,具体示例包括如下情景:
1)起飞
用户语音:起飞
***:生成起飞控制指令并发送至无人机
***反馈:无人机已准备好起飞/起飞成功/无人机没有完成解锁,无法起飞
2)悬停
用户语音:悬停
***:生成悬停控制指令并发送至无人机
***反馈:无人机已悬停
3)环绕
用户语音:开启环绕模式
***:生成开启环绕模式控制指令并发送至无人机
***反馈:环绕模式已开启
4)拉远
用户语音:拉远
***:生成拉远控制指令并发送至无人机
***反馈:正在拉远
5)升高
用户语音:升高
***:生成升高控制指令并发送至无人机
***反馈:正在升高,且已离地50米
6)降低
用户语音:降低
***:生成降低控制指令并发送至无人机
***反馈:正在降低,现离地15米
7)前进
用户语音:前进
***:生成前进控制指令并发送至无人机
***反馈:正在前进,飞机已离您800米远
8)后退
用户语音:后退
***:生成后退控制指令并发送至无人机
***反馈:正在后退,飞机距您还有100米
9)拉左
用户语音:拉左
***:生成拉左控制指令并发送至无人机
***反馈:正在拉左,飞机已偏离50米
10)拉右
用户语音:拉右
***:生成拉右控制指令并发送至无人机
***反馈:正在拉右,飞机已偏离50米
11)拍照
用户语音:拍照
***:生成拍照控制指令并发送至无人机
***反馈:完成拍照
12)录像
用户语音:开始录像
***:生成开始录像控制指令并发送至无人机
***反馈:正在录像
用户语音:停止录像
***:生成停止录像控制指令并发送至无人机
***反馈:录像已结束
13)调整飞机参数
用户语音:速度单位设置
***:生成速度单位设置控制指令并发送至无人机
***反馈:请选择速度单位:米/秒、公里/时、英里/时
用户语音:公里/时
***:生成将速度单位设置为公里/时的控制指令并发送至无人机
***反馈:设置成功
用户语音:返航高度设置
***:生成返航高度设置的控制指令并发送至无人机
***反馈:飞机未连接,无法进行该设置
可以理解的是,上述示例仅用于清楚的解释本发明,不应当理解为对本发明的限定。
本实施例中,获取到周围环境中的语音之后,首先根据语音的声强信息进行第一次识别,进一步的,再根据语音音色进行第二次识别,再根据预设的语音控制库进行第三次识别,由此可更准确的得到有效控制语音,避免干扰语音导致的误操作。可以理解的是,也可以先根据预设的语音控制库进行第一次识别,再根据语音的声强信息进行第二次识别,根据语音音色进行第三次识别;或者根据语音的声强信息进行第一次识别,根据预设的语音控制库进行第二次识别,根据语音音色进行第三次识别;或者其他可能的顺序。
通过本实施例,给用户提供了除触控、手势、头追等以外的操控方式,可以实现更多功能,也有更多实现功能的途径;无需操作复杂的控制菜单或者功能选项,通过遵循直觉的语音控制模式便可轻松控制飞行器实现各种飞行动作,简化了用户操控飞行器的方式,降低用户的学习成本,并且有利于提高飞行器操控的灵活度。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。此外,还可对上述实施例进行任意组合,得到其他的实施例。
基于与上述实施例中的基于智能终端的操控飞行器的方法相同的思想,本发明还提供基于智能终端的操控飞行器的装置,该装置可用于执行上述基于智能终端的操控飞行器的方法。为了便于说明,基于智能终端的操控飞行器的装置实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
图5为本发明一实施例的基于智能终端的操控飞行器的装置的示意性结构图;如图5所示,本实施例的基于智能终端的操控飞行器的装置包括:语音监测模块510、指令生成模块520以及指令发送模块530,各模块详述如下:
所述语音监测模块510,用于获取用户语音,识别所述语音中包含的有效控制语音;
所述指令生成模块520,用于根据所述有效控制语音生成对应的飞行器的控制指令;
所述指令发送模块530,用于向飞行器发送所述控制指令。
在一优选实施方式中,所述语音监测模块510包括:
第一识别单元,用于根据预设的语音控制库识别所述语音中包含的有效控制语音;
和/或,第二识别单元,用于根据所述语音对应的音色信息识别所述语音中包含的有效控制语音;
和/或,第二识别单元,用于根据所述语音的声强信息识别所述语音中包含的有效控制语音。
在一优选实施方式中,所述语音控制库中包含至少两个控制关键字;所述第一识别单元,用于识别所述语音对应的语义信息,若所述语义信息与语音控制库中的任一控制关键字匹配,则将所述语音识别为有效控制语音。
在一优选实施方式中,所述第二识别单元,用于识别所述语音的音色,根据预设的授权用户的语音音色判断所述语音是否来自授权用户;若是,将所述语音识别为有效控制语音。
在一优选实施方式中,所述第二识别单元,用于识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若所述语音中包含来自授权用户的语音成分,则提取所述语音中来自授权用户的语音成分,得到有效控制语音。
在一优选实施方式中,所述第二识别单元,用于识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若预设的授权用户为两个以上、且判断得出所述语音成分来自两个以上的授权用户,则获取所述语音成分对应的授权用户中优先级最高或声强最大的授权用户,作为第一授权用户;提取所述语音中来自第一授权用户的语音成分,得到有效的控制语音。
基于上述实施例的基于智能终端的操控飞行器的装置,对用户来说,无需操作复杂的控制菜单或者功能选项,通过遵循直觉的语音控制模式便可轻松控制飞行器实现各种飞行动作,简化了用户操控飞行器的方式,降低用户的学习成本,并且有利于提高飞行器操控的灵活度。
需要说明的是,上述示例的基于智能终端的操控飞行器的装置的实施方式中,各模块之间的信息交互、执行过程等内容,由于与本发明前述方法实施例基于同一构思,其带来的技术效果与本发明前述方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
此外,上述示例的基于智能终端的操控飞行器的装置的实施方式中,各功能模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的功能模块完成,即将所述基于智能终端的操控飞行器的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。其中各功能模既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,作为独立的产品销售或使用。所述程序在执行时,可执行如上述各方法的实施例的全部或部分步骤。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。可以理解,其中所使用的术语“第一”、“第二”等在本文中用于区分对象,但这些对象不受这些术语限制。
以上所述实施例仅表达了本发明的几种实施方式,不能理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种基于智能终端的操控飞行器的方法,其特征在于,包括:
获取用户语音,识别所述语音中包含的有效控制语音;
根据所述有效控制语音生成对应的飞行器的控制指令;
向飞行器发送所述控制指令。
2.根据权利要求1所述的基于智能终端的操控飞行器的方法,其特征在于,识别所述语音中包含的有效控制语音的步骤包括:
根据预设的语音控制库识别所述语音中包含的有效控制语音;
和/或,根据所述语音对应的音色信息识别所述语音中包含的有效控制语音;
和/或,根据所述语音的声强信息识别所述语音中包含的有效控制语音。
3.根据权利要求2所述的基于智能终端的操控飞行器的方法,其特征在于,所述语音控制库中包含至少两个控制关键字;
根据预设的语音控制库识别所述语音中包含的有效控制语音的步骤包括:
识别所述语音对应的语义信息,若所述语义信息与语音控制库中的至少一个控制关键字匹配,则将所述语音识别为有效控制语音。
4.根据权利要求2所述的基于智能终端的操控飞行器的方法,其特征在于,根据所述语音对应的音色信息识别所述语音中包含的有效控制语音的步骤包括:
识别所述语音的音色,根据预设的授权用户的语音音色判断所述语音是否来自授权用户;若是,将所述语音识别为有效控制语音。
5.根据权利要求2所述的基于智能终端的操控飞行器的方法,其特征在于,根据所述语音对应的音色信息识别所述语音中包含的有效控制语音的步骤包括:
识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;
若所述语音中包含来自授权用户的语音成分,则提取所述语音中来自授权用户的语音成分,得到有效控制语音。
6.根据权利要求2所述的基于智能终端的操控飞行器的方法,其特征在于,根据所述语音对应的音色信息识别所述语音中包含的有效控制语音的步骤包括:
识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;
若预设的授权用户为两个以上、且判断得出所述语音成分来自两个以上的授权用户,则获取所述语音成分对应的授权用户中优先级最高或声强最大的授权用户,作为第一授权用户;
提取所述语音中来自第一授权用户的语音成分,得到有效的控制语音。
7.根据权利要求2所述的基于智能终端的操控飞行器的方法,其特征在于,根据所述语音的声强信息识别所述语音中包含的有效控制语音的步骤包括:
若所述语音中仅有一个用户的语音,则检测所述语音的声强是否大于等于设定声强阈值,若是,则将所述语音识别为有效控制语音;
若所述语音中包含两个以上用户的语音,则提取声强最大的用户的语音作为有效控制语音;
或者,
若所述语音中包含两个以上用户的语音,则分别检测各用户语音的声强是否大于等于设定声强阈值,提取声强大于等于设定声强阈值的用户的语音作为有效控制语音。
8.根据权利要求3所述的基于智能终端的操控飞行器的方法,其特征在于,所述语音控制库中的控制关键字包括:起飞、悬停、环绕、拉远、跟随、升高、降低、前进、后退、拉左、拉右、调整飞行参数、调整相机参数、拍照、开始录像、停止录像中至少两种。
9.根据权利要求1所述的基于智能终端的操控飞行器的方法,其特征在于,识别所述语音中包含的有效控制语音的步骤之后,还包括:
若所述语音中不存在有效控制语音,忽略所述语音。
10.根据权利要求1至9任一所述的基于智能终端的操控飞行器的方法,其特征在于,向飞行器发送所述控制指令的步骤之后,还包括:
接收飞行器返回的对所述控制指令的执行信息,语音播报所述执行信息。
11.一种基于智能终端的操控飞行器的装置,其特征在于,包括:
语音监测模块,用于获取用户语音,识别所述语音中包含的有效控制语音;
指令生成模块,用于根据所述有效控制语音生成对应的飞行器的控制指令;
指令发送模块,用于向飞行器发送所述控制指令。
12.根据权利要求11所述的基于智能终端的操控飞行器的装置,其特征在于,语音监测模块包括:
第一识别单元,用于根据预设的语音控制库识别所述语音中包含的有效控制语音;
和/或,第二识别单元,用于根据所述语音对应的音色信息识别所述语音中包含的有效控制语音;
和/或,第二识别单元,用于根据所述语音的声强信息识别所述语音中包含的有效控制语音。
13.根据权利要求12所述的基于智能终端的操控飞行器的装置,其特征在于,所述语音控制库中包含至少两个控制关键字;
所述第一识别单元,用于识别所述语音对应的语义信息,若所述语义信息与语音控制库中的任一控制关键字匹配,则将所述语音识别为有效控制语音。
14.根据权利要求12所述的基于智能终端的操控飞行器的装置,其特征在于,所述第二识别单元,用于识别所述语音的音色,根据预设的授权用户的语音音色判断所述语音是否来自授权用户;若是,将所述语音识别为有效控制语音。
15.根据权利要求12所述的基于智能终端的操控飞行器的装置,其特征在于,所述第二识别单元,用于识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若所述语音中包含来自授权用户的语音成分,则提取所述语音中来自授权用户的语音成分,得到有效控制语音。
16.根据权利要求12所述的基于智能终端的操控飞行器的装置,其特征在于,所述第二识别单元,用于识别所述语音的音色,若识别到所述语音中包含两种以上音色的语音成分,则分别判断各语音成分是否来自授权用户;若预设的授权用户为两个以上、且判断得出所述语音成分来自两个以上的授权用户,则获取所述语音成分对应的授权用户中优先级最高或声强最大的授权用户,作为第一授权用户;提取所述语音中来自第一授权用户的语音成分,得到有效的控制语音。
17.根据权利要求12所述的基于智能终端的操控飞行器的装置,其特征在于,所述第
三识别单元,用于若所述语音中仅有一个用户的语音,则检测所述语音的声强是否大于等于设定声强阈值,若是,则将所述语音识别为有效控制语音;若所述语音中包含两个以上用户的语音,则提取声强最大的用户的语音作为有效控制语音;或者,若所述语音中包含两个以上用户的语音,则分别检测各用户语音的声强是否大于等于设定声强阈值,提取声强大于等于设定声强阈值的用户的语音作为有效控制语音。
18.根据权利要求11至17任一所述的基于智能终端的操控飞行器的装置,其特征在于,还包括:
反馈模块,用于接收飞行器返回的对所述控制指令的执行信息,语音播报所述执行信息。
CN201611115955.7A 2016-12-07 2016-12-07 基于智能终端的操控飞行器的方法和装置 Pending CN108172221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611115955.7A CN108172221A (zh) 2016-12-07 2016-12-07 基于智能终端的操控飞行器的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611115955.7A CN108172221A (zh) 2016-12-07 2016-12-07 基于智能终端的操控飞行器的方法和装置

Publications (1)

Publication Number Publication Date
CN108172221A true CN108172221A (zh) 2018-06-15

Family

ID=62526167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611115955.7A Pending CN108172221A (zh) 2016-12-07 2016-12-07 基于智能终端的操控飞行器的方法和装置

Country Status (1)

Country Link
CN (1) CN108172221A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979459A (zh) * 2019-02-28 2019-07-05 西安爱生技术集团公司 一种基于非特定人语音识别的四旋翼飞行器控制***
CN110910876A (zh) * 2019-11-25 2020-03-24 杭州智芯科微电子科技有限公司 物品声寻装置及控制方法、语音控制设置方法和***
CN111091838A (zh) * 2019-12-24 2020-05-01 中国航空工业集团公司沈阳飞机设计研究所 一种面向飞行器控制的开放式语音交互平台
CN111179926A (zh) * 2019-12-10 2020-05-19 深圳微品致远信息科技有限公司 航空器操控命令的生成方法、装置和计算机设备
CN111613222A (zh) * 2020-05-25 2020-09-01 广东电网有限责任公司 一种变电站巡检***
CN113703331A (zh) * 2021-08-27 2021-11-26 武汉市惊叹号科技有限公司 一种基于物联网集成平台的分布式控制***

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102233191A (zh) * 2010-05-07 2011-11-09 上海九鹰电子科技有限公司 一种兼有语音控制功能的航模
CN103743065A (zh) * 2014-01-20 2014-04-23 美的集团股份有限公司 空调器的控制方法、控制***、空调器和终端
CN103839547A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 比对语音操作信号以载入对应指令元素的***及其方法
CN103944983A (zh) * 2014-04-14 2014-07-23 美的集团股份有限公司 语音控制指令纠错方法和***
CN104579670A (zh) * 2013-10-28 2015-04-29 腾讯科技(深圳)有限公司 一种移动终端的身份验证方法和移动终端
CN104808674A (zh) * 2015-03-03 2015-07-29 广州亿航智能技术有限公司 多旋翼飞行器的控制***、终端及机载飞控***
CN104932527A (zh) * 2015-05-29 2015-09-23 广州亿航智能技术有限公司 一种飞行器的操控方法和装置
CN105009203A (zh) * 2013-03-12 2015-10-28 纽昂斯通讯公司 用于检测语音命令的方法和装置
CN105206275A (zh) * 2015-08-31 2015-12-30 小米科技有限责任公司 一种设备控制方法、装置及终端
CN105278380A (zh) * 2015-10-30 2016-01-27 小米科技有限责任公司 智能设备的控制方法和装置
CN105355195A (zh) * 2015-09-25 2016-02-24 小米科技有限责任公司 音频识别方法及装置
CN205131667U (zh) * 2015-10-28 2016-04-06 上海顺砾智能科技有限公司 一种无人机的语音识别远程控制装置
CN105573330A (zh) * 2015-03-03 2016-05-11 广州亿航智能技术有限公司 基于智能终端的飞行器操控方法
CN105620737A (zh) * 2016-02-26 2016-06-01 厦门大学嘉庚学院 用于直升型飞行器的语音遥控***及直升型遥控飞行器
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN106128456A (zh) * 2016-06-16 2016-11-16 美的集团股份有限公司 智能家电的语音控制方法、终端及***

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102233191A (zh) * 2010-05-07 2011-11-09 上海九鹰电子科技有限公司 一种兼有语音控制功能的航模
CN103839547A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 比对语音操作信号以载入对应指令元素的***及其方法
CN105009203A (zh) * 2013-03-12 2015-10-28 纽昂斯通讯公司 用于检测语音命令的方法和装置
CN104579670A (zh) * 2013-10-28 2015-04-29 腾讯科技(深圳)有限公司 一种移动终端的身份验证方法和移动终端
CN103743065A (zh) * 2014-01-20 2014-04-23 美的集团股份有限公司 空调器的控制方法、控制***、空调器和终端
CN103944983A (zh) * 2014-04-14 2014-07-23 美的集团股份有限公司 语音控制指令纠错方法和***
CN105573330A (zh) * 2015-03-03 2016-05-11 广州亿航智能技术有限公司 基于智能终端的飞行器操控方法
CN104808674A (zh) * 2015-03-03 2015-07-29 广州亿航智能技术有限公司 多旋翼飞行器的控制***、终端及机载飞控***
CN104932527A (zh) * 2015-05-29 2015-09-23 广州亿航智能技术有限公司 一种飞行器的操控方法和装置
CN105206275A (zh) * 2015-08-31 2015-12-30 小米科技有限责任公司 一种设备控制方法、装置及终端
CN105355195A (zh) * 2015-09-25 2016-02-24 小米科技有限责任公司 音频识别方法及装置
CN205131667U (zh) * 2015-10-28 2016-04-06 上海顺砾智能科技有限公司 一种无人机的语音识别远程控制装置
CN105278380A (zh) * 2015-10-30 2016-01-27 小米科技有限责任公司 智能设备的控制方法和装置
CN105620737A (zh) * 2016-02-26 2016-06-01 厦门大学嘉庚学院 用于直升型飞行器的语音遥控***及直升型遥控飞行器
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN106128456A (zh) * 2016-06-16 2016-11-16 美的集团股份有限公司 智能家电的语音控制方法、终端及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979459A (zh) * 2019-02-28 2019-07-05 西安爱生技术集团公司 一种基于非特定人语音识别的四旋翼飞行器控制***
CN110910876A (zh) * 2019-11-25 2020-03-24 杭州智芯科微电子科技有限公司 物品声寻装置及控制方法、语音控制设置方法和***
CN111179926A (zh) * 2019-12-10 2020-05-19 深圳微品致远信息科技有限公司 航空器操控命令的生成方法、装置和计算机设备
CN111091838A (zh) * 2019-12-24 2020-05-01 中国航空工业集团公司沈阳飞机设计研究所 一种面向飞行器控制的开放式语音交互平台
CN111613222A (zh) * 2020-05-25 2020-09-01 广东电网有限责任公司 一种变电站巡检***
CN113703331A (zh) * 2021-08-27 2021-11-26 武汉市惊叹号科技有限公司 一种基于物联网集成平台的分布式控制***

Similar Documents

Publication Publication Date Title
CN108172221A (zh) 基于智能终端的操控飞行器的方法和装置
US11289074B2 (en) Artificial intelligence apparatus for performing speech recognition and method thereof
CN107256707B (zh) 一种语音识别方法、***及终端设备
US11830482B2 (en) Method and apparatus for speech interaction, and computer storage medium
CN110047481A (zh) 用于语音识别的方法和装置
CN105284099B (zh) 针对免提交互来自动调整用户界面
CN109086276B (zh) 数据翻译方法、装置、终端及存储介质
CN106774845B (zh) 一种智能交互方法、装置及终端设备
CN108986564A (zh) 一种基于智能交互的报读控制方法及电子设备
KR102369083B1 (ko) 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US20210110815A1 (en) Method and apparatus for determining semantic meaning of pronoun
CN103903613A (zh) 一种信息处理方法及电子设备
US20210158802A1 (en) Voice processing method based on artificial intelligence
CN110310657A (zh) 一种音频数据处理方法及装置
CN106875939A (zh) 对大范围波动的汉语方言语音识别处理方法及智能机器人
CN109712610A (zh) 用于识别语音的方法和装置
KR20190096308A (ko) 전자기기
CN110473556A (zh) 语音识别方法、装置和移动终端
CN108897517B (zh) 一种信息处理方法及电子设备
CN109271503A (zh) 智能问答方法、装置、设备及存储介质
CN108766431A (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN108805035A (zh) 基于手势识别的教学互动方法以及装置
CN110910874A (zh) 一种互动课堂语音控制方法、终端设备、服务器和***
CN109074809B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
KR102369309B1 (ko) 파셜 랜딩 후 사용자 입력에 따른 동작을 수행하는 전자 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180615