CN104681025A - 利用语音识别的命令执行***及其工作方法 - Google Patents

利用语音识别的命令执行***及其工作方法 Download PDF

Info

Publication number
CN104681025A
CN104681025A CN201410474844.XA CN201410474844A CN104681025A CN 104681025 A CN104681025 A CN 104681025A CN 201410474844 A CN201410474844 A CN 201410474844A CN 104681025 A CN104681025 A CN 104681025A
Authority
CN
China
Prior art keywords
terminal
communication module
speech recognition
speech data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410474844.XA
Other languages
English (en)
Other versions
CN104681025B (zh
Inventor
金贤泰
韩尚佚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Mobis Co Ltd
Original Assignee
Hyundai Mobis Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Mobis Co Ltd filed Critical Hyundai Mobis Co Ltd
Publication of CN104681025A publication Critical patent/CN104681025A/zh
Application granted granted Critical
Publication of CN104681025B publication Critical patent/CN104681025B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • B60R2011/0294Apparatus with multi-functionalities, e.g. radio and telephone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种利用语音识别的命令执行***及其工作方法,该命令执行***包括通讯模块,其执行近距离无线通讯;第一终端,其接收用户的语音信号生成语音数据,并且在确认到与所述通讯模块的连接时传输所述语音数据;以及第二终端,其通过所述通讯模块从所述第一终端接收所述语音数据,并通过分析接收到的所述语音数据执行相关工作命令。本发明利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。

Description

利用语音识别的命令执行***及其工作方法
技术领域
本发明涉及一种语音识别技术,尤其涉及通过传输终端获取到的语音来控制其他设备的技术。
背景技术
考虑到交通安全,现在已禁止驾驶员在车辆行驶过程中使用手机。因此驾车过程中驾驶员只能通过免提装置使用手机。现在,可以通过执行无线通讯连接具有免提装置功能的车辆影音导航(AVN;Audio Video Navigation)***与手机的连接工作,以连接手机与AVN***。
例如,AVN***与手机可以通过蓝牙接口配对,可以从AVN***确认手机中的信息。蓝牙无线通讯方法设定使得只与用户允许的设备连接,而不向用户不希望连接的设备发起连接。因此,这种蓝牙无线通讯方法能够有效地利用有限的无线资源,用户可以快速设定与目标设备的连接。
但是这种蓝牙无线通讯方法不仅搜索目标设备,还搜索周边所有能够连接的设备,然后为用户提供可连接设备列表,因此会耗费用于搜索所有可连接设备的预定时间。
另外在控制AVN***时,驾驶员(使用者)可直接操作AVN***来进行控制,或者可以通过操作手机来控制AVN***。例如,在利用AVN***的导航搜索地址时,驾驶员需要直接激活AVN***的导航,并利用触摸屏等键盘输入地址。
但由于这些动作需要驾驶员直接键入,不方便使用,当车辆处于行驶状态时是一种影响驾驶的危险行为,还可能引发交通事故。
发明内容
技术问题
本发明的目的为提供一种能够通过终端识别用户语音以控制其他设备的技术方案。
技术方案
为解决上述技术问题,根据本发明一个方面的利用语音识别的命令执行***,是利用设置于车辆的语音识别的命令执行***,其包括:第一终端,其利用基于统计声学模型将接收到的用户的语音转换为语音数据;通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词,并运行有关所述关键词的应用程序(application program)。
另外为解决上述技术问题,根据本发明一个方面的利用语音识别的命令执行方法,是利用设置于车辆的语音识别的命令执行***的第二终端的命令执行方法,其包括:通过通讯模块从第一终端接收语音数据的步骤;通过分析接收到的所述语音数据的图形提取关键词的步骤;以及向执行关于所述关键词的工作命令的应用程序(application program)传递所述关键词的步骤。
技术效果
根据本发明的实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
附图说明
图1为本发明实施例的利用语音识别的命令执行***的框图;
图2A及图2B为说明本发明的终端间近距离无线通讯的示意图;
图3为说明本发明的将用户语音数据化的工作的示意图;
图4为说明本发明的分析语音数据的工作的示意图;
图5为本发明实施例的利用语音识别的命令执行方法的流程图。
附图标记说明
10:命令执行***  100:第一终端
200:通讯模块     300:第二终端
具体实施方式
利用设置于车辆的语音识别的命令执行***包括:第一终端,其利用基于统计声学模型将用户的语音转换为语音数据;通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词,并运行有关所述关键词的应用程序(application program)。
其中,所述第一终端是所述用户的移动通信终端机,所述第二终端是车辆音响主机单元,所述通讯模块是近场通讯(NFC;Near Field Communication)模块。
所述第一终端在靠近所述通讯模块而被所述通讯模块标记(tagging)时,将所述语音数据传输到所述第二终端,其中所述第一终端依次执行基于所述基于统计声学模型的抽样过程、噪声去除过程及特征提取过程,将所述语音信号转换为所述语音数据,并将转换的所述语音数据转换为近场通讯数据交换格式(NDEF;NFC Data Exchange Format)协议形态。
所述关键词是关于所述应用程序中执行的工作命令的单词,所述第二终端的所述应用程序执行对应于提取到的所述关键词的工作命令。
所述第二终端在分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息。
利用设置于车辆的语音识别的命令执行***的第二终端的命令执行方法包括:通过通讯模块从第一终端接收语音数据的步骤;通过分析接收到的所述语音数据的图形提取关键词的步骤;以及向执行关于所述关键词的工作命令的应用程序传递所述关键词的步骤。
接收的所述步骤包括以有线或无线通讯方式接收所述第一终端靠近所述通讯模块而从所述第一终端无线传递到所述通讯模块的所述语音数据的步骤。
所述通讯模块是近场通讯(NFC;Near Field Communication)模块,接收的所述步骤包括当所述第一终端靠近所述通讯模块而被所述通讯模块标记(tagging)时,通过所述通讯模块从所述第一终端接收所述语音数据的步骤。
接收的所述步骤包括接收在所述第一终端根据基于统计声学模型转换用户的语音信号并转换成近场通讯数据交换格式(NDEF;NFC Data ExchangeFormat)协议形态的所述语音数据的步骤。
提取的所述步骤包括将关于所述应用程序执行的工作命令的单词作为所述关键词来提取的步骤。
还包括所述应用程序执行对应于所述关键词的工作命令的步骤以及当分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息的步骤。
通过结合附图说明的优选实施例,上述及其他本发明的实施形态将会更加清楚。为使本领域的普通技术人员能够根据这些实施例理解和实施本发明,以下对本发明进行详细说明。
图1为本发明实施例的利用语音识别的命令执行***的框图。如图所示,命令执行***10包括第一终端100、通讯模块200及第二终端300。
首先,通讯模块200是执行近距离无线通讯的模块。例如,通讯模块200是用于近距离无线通讯中的近场通讯(NFC;Near Field Communication)的NFC通讯模块。
NFC模块是电子标签(RFID)的一种,是使用13.56MHz频带的非接触式近距离无线通讯模块,是用于实现相隔10cm近距离的终端机间数据传输的模块。NFC模块可使用数据读取及写入功能,因此不需要现有的使用RFID所必须的读取器,并且无需像蓝牙等现有近距离通讯另外设定设备间连接。
并且,NFC利用感应电流的原理,感应电流的原理由英国物理学家法拉第(Faraday)发现,是当磁场靠近线圈时线圈中瞬间产生电流的原理。例如如图2中(A)所示,当磁铁22往复第一线圈21时第二线圈23中也产生电流。
NFC模块可按照上述感应电流的原理工作。此时如图2中(B)所示,NFC模块可利用读取器(reader)24与卡(标签)25工作。例如,读取器24具有其作用相同于第一线圈21的天线,因此当施加电流时会产生持续变化的连续性信号磁场。另外,卡25上具有围绕卡25的第二线圈23,因此当靠近读取器24时线圈中产生电流。此时产生的电流促使内置于卡25的存储芯片工作,因此读取器24能够读取存储在芯片上的信息。
即,当具有卡25的第一终端100靠近具有读取器24的通讯模块200时产生电流,因此具有通讯模块200的读取器24能够读取记录在内置于第一终端100内的存储器的信息。另外,如上读取到的信息可传输到第二终端300。
第一终端100接收用户的语音信号并用此生成语音数据,并通过通讯模块200将生成的语音数据传输到第二终端300。为接收用户的语音信号,第一终端100包括用于获取用户语音的麦克风。另外,为了将通过麦克风接收到的用户的语音信号生成为语音数据,第一终端100有内置的语音处理器。
为进行语音处理,第一终端100可包括语音识别部110、抽样部120、噪声去除部130及数据化部140。另外,第一终端包括用于存储(临时存储)生成的语音数据的存储器,为了连接用于向第二终端300传输语音数据的通讯模块200,可以内置卡(NFC卡)。
例如,第一终端100可以是现在普遍使用的内置麦克风的移动通信终端机(例如智能手机)。又例如,第一终端100还可以是一般的录音装置(录音机)。以下以本发明的第一终端100是智能手机为例进行说明。
第一终端100通过语音识别部110(例如麦克风)获取(识别)用户的语音。在此,当用户具有向第二终端300传输数据(语音数据)的意向,从而向第一终端100输入请求信号时,第一终端100通过语音识别部110获取用户的语音。例如,第一终端100在用户选择NFC按键时通过语音识别部110获取用户的语音。
此时,用户向第一终端100的麦克风准确地发音关键词及附加信息。其中关键词是关于之后由第二终端300的应用程序执行的工作命令的单词,附加信息是关于应用程序执行的工作命令的具体信息。
例如,当从用户接收到语音“兴趣点(或导航***)(POI(or NAVI)):首尔特别市江南区瑞草洞00号”时,第二终端300中驱动与关键词“POI”相关的导航应用程序,还可以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点存储的工作。
又例如,当从用户接收到语音“存储号码:010-0000-0000”时,第二终端300中驱动与关键词“存储号码”相关的联系方式应用程序,还可以执行将附加信息“010-0000-0000”作为联系方式存储的工作。
当通过语音识别部110接收到语音信号时,第一终端100利用语音处理器生成语音数据。其中,第一终端100对从用户接收到的语音信号执行图3中(a)所示的多个过程中的至少一个过程,以生成语音数据。例如,在步骤S310中通过第一终端100的语音识别部110从用户接收语音信号。在步骤S320中,抽样部120对通过语音识别部110接收到的语音信号抽样。在步骤S330中,噪声去除部130去除抽样部120抽样的语音信号中的噪声。在步骤S340中,数据化部140在噪声去除部130去除噪声后的语音信号中提取特征,以生成语音数据。即如图3中(B)所示,从用户接收到的语音信号(模拟信号)可以在经过预处理过程S350及特征提取过程S360之后,经过利用预先构筑的信息的基于统计声学模型的训练过程S370进行译码S380,以生成语音数据(数字信号)。
另外,第一终端100确认是否生成语音数据,若语音信号未生成为语音数据,则通过输出提示信息来请求用户再次输入语音,例如,第一终端100可通过显示语音重新输入(重新识别)请求信息来向用户请求重新输入语音。
第一终端100为了将生成的语音数据传输到第二终端300,执行按通讯模块200的协议数据格式转换语音数据的过程。例如,第一终端可以将语音数据转换为NDEF(NFC Data Exchange Format)协议形态。
如上转换的语音数据可通过通讯模块200(NFC模块)传输到第二终端300。此时,转换的语音数据在第一终端100与通讯模块200间确认连接时,可通过通讯模块200传输到第二终端300。优选地,当第一终端100靠近通讯模块200而被读取器(标签)标记时,可确认第一终端100与通讯模块200建立了连接。即,转换语音数据后,当第一终端100因用户而被通讯模块200标记时,第一终端100确认第一终端100与通讯模块200间建立了通讯连接,因此向第二终端300传输语音数据。
转换语音数据后,若确认出未与通讯模块200连接,则第一终端100将转换的语音数据存储在存储器上。或者,第一终端100不论是否与通讯模块200建立通讯连接,可以无条件地将转换的语音数据存储在存储器上。之后,若确认与通讯模块200建立连接,语音数据传输到第二终端300,则第一终端100可删除存储在存储器上的语音数据。
第二终端300用于分析接收到的语音数据,以执行其相关工作命令。优选地,第二终端300可以是控制车辆的AVN(Audio、Video、Navigation)***的音响主机单元。或者,第二终端300可以是控制车辆的整个免提***的控制单元。第二终端300可以是具有多个应用程序的终端设备。本发明中以第二终端300是控制AVN***及免提***的音响主机单元为例进行说明。其中,第二终端300包括用于将语音数据转换处理为文字的语音识别处理器(例如,语音转文本(STT;Speech To Text))。为此,第二终端300可以包括数据分析部310、图形比较部320、信息提取部330、应用程序(App)传递部340及应用程序执行部350。
第二终端300分析处理通过通讯模块200从第一终端100接收到的语音数据(比较图形(图4中(A)))提取关键词及附加信息。例如,当在步骤S410中从第一终端100接收到语音数据时,在步骤S420中利用语音识别引擎分析语音数据。此时第二终端300通过数据分析部310分析从第一终端100接收到的语音数据,并通过图形比较部320比较经过分析的语音数据与预先存储的信息的图形。根据图形比较结果,在步骤S430中第二终端300通过信息提取部330从语音数据中提取信息(关键词及附加信息)。即,第二终端300可以通过语音识别处理器(数据分析部310、图形比较部320、信息提取部330的处理器)分析处理语音数据(分析及图形比较),以提取关键词及附加信息。
其中,关键词是可内置在第二终端300工作的应用程序中执行的工作命令或相关单词,可预先存储在存储器(第二终端的存储器)上。
例如,当用户输入语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”,从而接收到语音数据时,第二终端300可提取关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”。又例如,当用户输入语音“存储号码,010-0000-0000”,从而接收到语音数据时,第二终端300可提取附加信息“010-0000-0000”及关键词“存储号码”。
进而,第二终端300通过提取到的关键词及附加信息执行内置应用程序(App)的相应命令。例如,第二终端300的应用程序(App)传递部340向有关提取到的关键词及附加信息的应用程序传递相应信息(关键词及附加信息)。应用程序执行部350启动接收到相应信息(关键词及附加信息)的应用程序,以执行相应命令。
例如,当从语音数据“POI(或NAVI):首尔特别市江南区瑞草洞00号”提取到关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”时,第二终端300运行内置应用程序中的导航。并且,执行导航功能中的POI(兴趣点)功能,以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点输入的工作。
又例如,当从语音数据“存储号码:010-0000-0000”提取到附加信息“010-0000-0000”和关键词“存储号码”时,第二终端300运行内置应用程序中的联系方式应用程序。并且,第二终端300可以执行联系方式应用程序功能中的号码存储功能,将附加信息“010-0000-0000”作为联系方式存储。
另外,有一种情况是第二终端300提取了关键词及附加信息,但是仅凭提取到的关键词确定不了应执行的应用程序及其工作。例如,第二终端300内没有预先存储关于获取到的关键词及相关应用程序的情况,或者是存储器中没有预先存储相关单词的情况,遇到这些情况时,在步骤S440中第二终端300判断提取到的关键词的意思模糊。
若步骤S440的判断结果为关键词的意思不模糊,则在步骤S450中第二终端300输出相关应用程序的执行结果。
若步骤S440中因图形分析失败而判断关键词意思模糊,则在步骤S450中第二终端300还判断附加信息的意思模糊性。此时,若判断结果为关键词意思模糊,但附加信息意思不模糊,则第二终端300可利用附加信息推测能够运行的程序。在此类情况下,第二终端300可通过确认附加信息种类来运行相关应用程序。
例如,由于受到用户发音影响或第一终端100出现关于语音信号的语音处理错误,导致用户的发音“搜索地址:首尔特别市江南区瑞草洞00号”被接收成“搜索:首尔特别市江南区瑞草洞00号”时,第二终端300仅凭关键词“搜索”判断不出该执行哪个程序。此时,第二终端300可通过附加信息“首尔特别市江南区瑞草洞00号”推测语音数据与地址有关,从而能够执行与地址相关的导航。
另外,可以预先设定相应程序的基本工作,例如,当导航的基本工作为“搜索地址”时,第二终端300只需附加信息即可运行导航,以搜索附加信息“首尔特别市江南区瑞草洞00号”所指的地址。若导航的基本工作为“查找捷径”,则第二终端300只需附加信息即可运行导航,能够搜索出从当前位置到附加信息所指地址的最快路线。
又例如,由于受到用户发音影响或第一终端100出现关于语音信号的语音处理错误,导致用户的发音“拨打电话:010-0000-0000”被接收成“电话:010-0000-0000”时,第二终端300可通过关键词“电话”运行联系方式应用程序,但无法判断应该执行联系方式应用程序中的哪个工作。这种情况下若联系方式应用程序的基本工作已预先设定为“存储联系方式”,则第二终端300可执行将附加信息“010-0000-0000”存储到联系方式中的工作。或者,若联系方式应用程序的基本工作为“拨打电话”,则即使未正确提取出关键词,第二终端300也能够按用户意图执行向“010-0000-0000”拨打电话的工作。
即,可以对第二终端300设定使得应用程序在只提取到部分关键词时(意思模糊的情况),若存在预先指定的至少一种基本工作,则执行与提取到的关键词相似的基本工作(Default)。
若关键词及附加信息的意思均模糊,则在步骤S460中第二终端300输出错误消息。其中,第二终端300输出的错误消息传输到第一终端100,因此用户能够进行确认。例如,第二终端300输出的错误消息可通过通讯模块200传递到第一终端100。
根据如上所述的本发明实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
图5为根据本发明实施例的利用语音识别的命令执行方法的流程图。
首先在步骤S510中,命令执行***10确认是否有用户的按键输入操作,该按键用于通过第一终端100的语音识别来驱动命令***。
其中,第一终端100是用于获取用户语音的具有内置麦克风的终端。例如,第一终端100可以是现在普遍使用的具有内置麦克风的移动通信终端(例如智能手机)。又例如,第一终端100还可以是一般的录音装置(录音机)。
具体来讲,可通过用户对第一终端100的按键操作动作来确认用户是否具有通过语音识别来驱动命令***的意向。例如,当通过用户操作激活第一终端100的录音功能时,第一终端100确认为具有向第二终端300传递信息的意向。又例如,当通过用户操作激活第一终端100的近距离无线通讯(例如,NFC)功能时,确认为具有向第二终端300传递信息的意向。
当步骤S510中确认到具有用于通过语音识别来驱动命令***的按键操作时,在步骤S520中命令执行***10从第一终端100接收用户的语音信号。
此时,用户向第一终端100的麦克风准确发音关键词及附加信息。其中,关键词是关于之后在第二终端300的应用程序中执行的工作的单词,附加信息是关于应用程序执行的工作的具体信息。
例如,当从用户获取到语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”时,第二终端300中执行与“POI”相关的导航应用程序,并且可以执行将“首尔特别市江南区瑞草洞00号”作为兴趣点存储的工作。又例如,当从用户接收到语音“存储号码:010-0000-0000”时,第二终端300中执行与“存储号码”相关的联系方式应用程序,并可以执行将“010-0000-0000”作为联系方式存储的工作。
当接收到用户语音信号时,在步骤S530中命令执行***10在第一终端100中利用语音处理器生成语音数据。
具体来讲,第一终端100对从用户接收到的语音信号执行语音处理器的抽样过程、噪声去除过程及特征提取过程中至少一个过程,以生成语音数据。优选地,可通过对从用户接收到的语音信号(模拟信号)进行抽样、噪声去除、特征提取过程生成语音数据(数字数据)。
另外,第一终端100确认是否生成语音数据,若语音信号未生成为语音数据,则通过输出提示信息来请求用户再次输入语音。优选地,第一终端100可通过显示重新输入语音请求信息来向用户请求重新输入语音。
进而,第一终端100为了将生成的语音数据传输到第二终端300,执行按通讯模块200的协议数据格式转换语音数据的过程。具体来讲,第一终端100可以将语音数据转换为NDEF(NFC Data Exchange Format)协议形态。另外,第一终端100可以将转换成NDEF协议形态的语音数据存储到存储器中。
在步骤S540中,命令执行***10确认第一终端100与通信模块200之间的通信连接。
优选地,命令执行***10可以在第一终端100靠近通讯模块200而被读取器(标签)标记时,确认为第一终端100与通讯模块200建立了连接。即,当第一终端100转换语音数据后第一终端100因用户而被通讯模块200标记时,命令执行***10可以确认第一终端100与通讯模块200间的通讯连接。
当确认建立了通讯连接时,在步骤S550中命令执行***10把第一终端100的语音数据传输到第二终端300。
其中,第二终端300可以是控制车辆AVN(Audio、Video、Navigation)的音响主机单元。或者,第二终端300可以是控制车辆的整个免提***的控制单元。第二终端300可以是具有多个应用程序的终端设备。
在步骤S560中,命令执行***10在第二终端300分析处理接收到的语音数据以提取信息。
具体来讲,第二终端300可利用将语音数据转换处理为文字的语音识别处理器(例如STT(Speech To Text))分析处理语音数据(图形比较),以提取关键词及附加信息。
例如,当用户输入语音“POI(或NAVI):首尔特别市江南区瑞草洞00号”,从而接收到语音数据时,第二终端300可提取关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”。又例如,当用户输入语音“存储号码:010-0000-0000”,从而接收到语音数据时,第二终端300可提取附加信息“010-0000-0000”及关键词“存储号码”。此时,关键词是能够内置于第二终端300工作的应用程序执行的工作或相关单词,可以预先存储在存储器(第二终端的存储器)中。
在步骤S570中,命令执行***10利用提取到的信息执行第二终端300的应用程序的相应动作。
例如,当从语音数据“POI(或NAVI):首尔特别市江南区瑞草洞00号”提取到关键词“POI”及附加信息“首尔特别市江南区瑞草洞00号”时,第二终端300运行内置应用程序中的导航。并且,执行导航功能中的POI(兴趣点)功能,以执行将附加信息“首尔特别市江南区瑞草洞00号”作为兴趣点输入的工作。
又例如,当从语音数据“存储号码:010-0000-0000”提取到附加信息“010-0000-0000”和关键词“存储号码”时,第二终端300运行内置应用程序中的联系方式应用程序。并且,第二终端300可以执行联系方式应用程序功能中的号码存储功能,将附加信息“010-0000-0000”作为联系方式存储。
根据如上所述的本发明实施例,利用从用户的便携终端机获取到的用户的语音信息驱动存储在音响主机单元的应用程序并执行相应动作,便携终端机与音响主机单元通过近场通讯的近距离无线通讯收发信息,省去了用户直接键入信息所带来的繁琐问题,省略了蓝牙等设备之间的其他认证过程,因此提高了用户便利性。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (15)

1.一种利用语音识别的命令执行***,是利用设置于车辆的语音识别的命令执行***,其特征在于,包括:
第一终端,其利用基于统计声学模型将接收到的用户的语音转换为语音数据;
通讯模块,其在所述第一终端靠近时无线接收所述语音数据;以及
第二终端,其通过所述通讯模块以有线或无线通讯方式接收所述语音数据,通过分析所述语音数据的图形提取关键词,并运行有关所述关键词的应用程序。
2.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述通讯模块是近场通讯模块。
3.根据权利要求2所述的利用语音识别的命令执行***,其特征在于:
所述第一终端在靠近所述通讯模块而被所述通讯模块标记时,将所述语音数据传输到所述第二终端。
4.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述第一终端依次执行基于所述基于统计声学模型的抽样过程、噪声去除过程及特征提取过程,将所述语音信号转换为所述语音数据,并将转换的所述语音数据转换为近场通讯数据交换格式协议形态。
5.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述关键词是关于所述应用程序中执行的工作命令的单词。
6.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述第二终端的应用程序执行对应于提取到的所述关键词的工作命令。
7.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述第二终端在分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息。
8.根据权利要求1所述的利用语音识别的命令执行***,其特征在于:
所述第一终端是所述用户的移动通信终端机,所述第二终端是车辆音响主机单元。
9.一种利用语音识别的命令执行方法,是利用设置于车辆的语音识别的命令执行***的第二终端的命令执行方法,其特征在于,包括:
通过通讯模块从第一终端接收语音数据的步骤;
通过分析接收到的所述语音数据的图形提取关键词的步骤;以及
向执行关于所述关键词的工作命令的应用程序传递所述关键词的步骤。
10.根据权利要求9所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
以有线或无线通讯方式接收所述第一终端靠近所述通讯模块而从所述第一终端无线传递到所述通讯模块的所述语音数据的步骤。
11.根据权利要求9所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
当所述第一终端靠近所述通讯模块而被所述通讯模块标记时,通过所述通讯模块从所述第一终端接收所述语音数据的步骤。
12.根据权利要求11所述的利用语音识别的命令执行方法,其特征在于,接收的所述步骤包括:
接收在所述第一终端根据基于统计声学模型转换用户的语音信号并转换成近场通讯数据交换格式协议形态的所述语音数据的步骤。
13.根据权利要求9所述的利用语音识别的命令执行方法,其特征在于,提取的所述步骤包括:
将关于所述应用程序执行的工作命令的单词作为所述关键词来提取的步骤。
14.根据权利要求13所述的利用语音识别的命令执行方法,其特征在于,还包括:
所述应用程序执行对应于所述关键词的工作命令的步骤。
15.根据权利要求9所述的利用语音识别的命令执行方法,其特征在于,还包括:
当分析所述语音数据的图形失败时,通过所述通讯模块向所述第一终端传输错误消息的步骤。
CN201410474844.XA 2013-11-26 2014-09-17 利用语音识别的命令执行***及其工作方法 Active CN104681025B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130144544A KR102197143B1 (ko) 2013-11-26 2013-11-26 음성 인식을 이용한 명령 수행 시스템 및 그 동작 방법
KR10-2013-0144544 2013-11-26

Publications (2)

Publication Number Publication Date
CN104681025A true CN104681025A (zh) 2015-06-03
CN104681025B CN104681025B (zh) 2018-04-20

Family

ID=53315980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410474844.XA Active CN104681025B (zh) 2013-11-26 2014-09-17 利用语音识别的命令执行***及其工作方法

Country Status (2)

Country Link
KR (1) KR102197143B1 (zh)
CN (1) CN104681025B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979083A (zh) * 2016-04-29 2016-09-28 珠海市魅族科技有限公司 一种图形展示方法及装置
CN106412315A (zh) * 2016-10-31 2017-02-15 努比亚技术有限公司 一种nfc标签、方法、***及移动终端
CN107808670A (zh) * 2017-10-25 2018-03-16 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
CN107819472A (zh) * 2017-11-14 2018-03-20 安徽森力汽车电子有限公司 车载收音机
CN107919131A (zh) * 2017-12-11 2018-04-17 广东小天才科技有限公司 一种通过麦克风设备控制用户终端的方法及***
CN109830239A (zh) * 2017-11-21 2019-05-31 群光电子股份有限公司 语音处理装置、语音识别输入***及语音识别输入方法
WO2023065854A1 (zh) * 2021-10-22 2023-04-27 华为技术有限公司 分布式语音控制方法及电子设备

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060106614A1 (en) * 2004-11-16 2006-05-18 Microsoft Corporation Centralized method and system for clarifying voice commands
CN1828682A (zh) * 2005-03-01 2006-09-06 峻扬实业股份有限公司 语音辨识闸道装置
CN101499277A (zh) * 2008-07-25 2009-08-05 中国科学院计算技术研究所 一种服务智能导航方法和***
CN101604233A (zh) * 2004-02-06 2009-12-16 刘新斌 一种用于交互控制的语音虚拟键盘的使用方法
JP2010073105A (ja) * 2008-09-22 2010-04-02 Sony Corp 情報処理装置および方法、プログラム、並びに、情報処理システム
CN102006373A (zh) * 2010-11-24 2011-04-06 深圳市子栋科技有限公司 基于语音命令控制的车载服务***及方法
CN102322866A (zh) * 2011-07-04 2012-01-18 深圳市子栋科技有限公司 基于自然语音识别的导航方法和***
CN102800178A (zh) * 2012-07-12 2012-11-28 李凯 遥控玩具的控制方法
CN102891706A (zh) * 2011-07-20 2013-01-23 Lg电子株式会社 移动终端和控制该移动终端的方法
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN103021403A (zh) * 2012-12-31 2013-04-03 威盛电子股份有限公司 基于语音识别的选择方法及其移动终端装置及信息***
CN202906954U (zh) * 2012-08-21 2013-04-24 无锡爱睿芯电子有限公司 一种远距离语音遥控***
CN103116410A (zh) * 2011-08-10 2013-05-22 Lg电子株式会社 移动终端及其控制方法
CN103187059A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 基于车载应用的语音处理***
CN103187079A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载信息***
CN103209009A (zh) * 2013-02-28 2013-07-17 山东大学 一种采用nfc配对的服务器无线输入设备及其工作方法
KR20130123613A (ko) * 2012-05-03 2013-11-13 현대엠엔소프트 주식회사 음성인식 경로안내장치 및 방법
CN203301528U (zh) * 2013-04-09 2013-11-20 上海禾未新能源科技有限公司 一种信息交互***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000025292A (ko) * 1998-10-09 2000-05-06 김영환 잡음환경에서의 핵심어 검출에 적합한 음성특징 추출방법
KR100577387B1 (ko) * 2003-08-06 2006-05-10 삼성전자주식회사 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
US9257115B2 (en) * 2012-03-08 2016-02-09 Facebook, Inc. Device for extracting information from a dialog

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604233A (zh) * 2004-02-06 2009-12-16 刘新斌 一种用于交互控制的语音虚拟键盘的使用方法
US20060106614A1 (en) * 2004-11-16 2006-05-18 Microsoft Corporation Centralized method and system for clarifying voice commands
CN1828682A (zh) * 2005-03-01 2006-09-06 峻扬实业股份有限公司 语音辨识闸道装置
CN101499277A (zh) * 2008-07-25 2009-08-05 中国科学院计算技术研究所 一种服务智能导航方法和***
JP2010073105A (ja) * 2008-09-22 2010-04-02 Sony Corp 情報処理装置および方法、プログラム、並びに、情報処理システム
CN102006373A (zh) * 2010-11-24 2011-04-06 深圳市子栋科技有限公司 基于语音命令控制的车载服务***及方法
CN102322866A (zh) * 2011-07-04 2012-01-18 深圳市子栋科技有限公司 基于自然语音识别的导航方法和***
CN102891706A (zh) * 2011-07-20 2013-01-23 Lg电子株式会社 移动终端和控制该移动终端的方法
CN103116410A (zh) * 2011-08-10 2013-05-22 Lg电子株式会社 移动终端及其控制方法
CN103187059A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 基于车载应用的语音处理***
CN103187079A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载信息***
KR20130123613A (ko) * 2012-05-03 2013-11-13 현대엠엔소프트 주식회사 음성인식 경로안내장치 및 방법
CN102800178A (zh) * 2012-07-12 2012-11-28 李凯 遥控玩具的控制方法
CN202906954U (zh) * 2012-08-21 2013-04-24 无锡爱睿芯电子有限公司 一种远距离语音遥控***
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN103021403A (zh) * 2012-12-31 2013-04-03 威盛电子股份有限公司 基于语音识别的选择方法及其移动终端装置及信息***
CN103209009A (zh) * 2013-02-28 2013-07-17 山东大学 一种采用nfc配对的服务器无线输入设备及其工作方法
CN203301528U (zh) * 2013-04-09 2013-11-20 上海禾未新能源科技有限公司 一种信息交互***

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105979083A (zh) * 2016-04-29 2016-09-28 珠海市魅族科技有限公司 一种图形展示方法及装置
CN106412315A (zh) * 2016-10-31 2017-02-15 努比亚技术有限公司 一种nfc标签、方法、***及移动终端
CN106412315B (zh) * 2016-10-31 2020-05-01 努比亚技术有限公司 Nfc标签、设置nfc标签的方法、nfc标签***及移动终端
CN107808670A (zh) * 2017-10-25 2018-03-16 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
CN107808670B (zh) * 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
CN107819472A (zh) * 2017-11-14 2018-03-20 安徽森力汽车电子有限公司 车载收音机
CN107819472B (zh) * 2017-11-14 2020-04-17 安徽森力汽车电子有限公司 车载收音机
CN109830239A (zh) * 2017-11-21 2019-05-31 群光电子股份有限公司 语音处理装置、语音识别输入***及语音识别输入方法
CN109830239B (zh) * 2017-11-21 2021-07-06 群光电子股份有限公司 语音处理装置、语音识别输入***及语音识别输入方法
CN107919131A (zh) * 2017-12-11 2018-04-17 广东小天才科技有限公司 一种通过麦克风设备控制用户终端的方法及***
WO2023065854A1 (zh) * 2021-10-22 2023-04-27 华为技术有限公司 分布式语音控制方法及电子设备

Also Published As

Publication number Publication date
KR102197143B1 (ko) 2020-12-31
KR20150060300A (ko) 2015-06-03
CN104681025B (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN104681025A (zh) 利用语音识别的命令执行***及其工作方法
KR101972955B1 (ko) 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
CN112970059B (zh) 用于处理用户话语的电子装置及其控制方法
CN104282302A (zh) 用于识别语音和文本的设备和方法
CN102842306A (zh) 语音控制方法及装置、语音响应方法及装置
CN104536978A (zh) 识别语音数据的方法和装置
CN103687061A (zh) 连接建立方法及终端
CN104360736A (zh) 基于手势的终端控制方法和***
CN107710322A (zh) 信息提供***、信息提供方法和计算机可读记录介质
US20200088533A1 (en) Navigation Method, Navigation Device, and Storage Medium
CN103620528B (zh) 利用附件选择文本预测结果
CN103674012A (zh) 语音定制方法及其装置、语音识别方法及其装置
CN103914672A (zh) 用于在便携式终端中提供近场通信功能的装置和方法
CN109949795A (zh) 一种控制智能设备交互的方法及装置
CN105825158A (zh) Nfc设备、阅读器、***、及配置数据传输方法
CN105091236A (zh) 一种基于语音识别的空调器控制方法及其控制***
CN104881612A (zh) 数据删除方法及装置
CN104992715A (zh) 一种智能设备的界面切换方法及***
CN105094830A (zh) 一种执行目标功能的方法和装置
KR102629796B1 (ko) 음성 인식의 향상을 지원하는 전자 장치
CN103399737B (zh) 基于语音数据的多媒体处理方法及装置
CN103782319A (zh) 提供音频内容的方法和设备、用户终端和计算机可读记录介质
CN104636320A (zh) 数据处理方法及装置
CN111897916A (zh) 语音指令识别方法、装置、终端设备及存储介质
CN105072243A (zh) 来电提示方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant