CN102006373B - 基于语音命令控制的车载服务***及方法 - Google Patents

基于语音命令控制的车载服务***及方法 Download PDF

Info

Publication number
CN102006373B
CN102006373B CN201010556994.7A CN201010556994A CN102006373B CN 102006373 B CN102006373 B CN 102006373B CN 201010556994 A CN201010556994 A CN 201010556994A CN 102006373 B CN102006373 B CN 102006373B
Authority
CN
China
Prior art keywords
added service
value
voice
terminal equipment
cloud computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010556994.7A
Other languages
English (en)
Other versions
CN102006373A (zh
Inventor
沈嘉鑫
王力劭
许军
庞泽耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu cheYin Intelligent Technology Co.,Ltd.
Original Assignee
SHENZHEN VCYBER TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN VCYBER TECHNOLOGY Co Ltd filed Critical SHENZHEN VCYBER TECHNOLOGY Co Ltd
Priority to CN201010556994.7A priority Critical patent/CN102006373B/zh
Publication of CN102006373A publication Critical patent/CN102006373A/zh
Application granted granted Critical
Publication of CN102006373B publication Critical patent/CN102006373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Navigation (AREA)

Abstract

本发明实施例公开了一种基于语音命令控制的车载服务***及方法。涉及车载服务技术,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的。本发明实施例提供的技术方案可以应用在如汽车等交通工具中。

Description

基于语音命令控制的车载服务***及方法
技术领域
本发明涉及车载服务技术,尤其涉及基于语音命令控制的车载服务***及方法。
背景技术
当前,移动网络的发展非常迅速,基于移动网络的应用可以让人们在移动中获得更多更丰富的资讯和服务。随着车载技术的发展,车载设备也可以通过SIM卡进行无线通信,使用户在行车的过程中通过车载设备获取无线运营商提供的增值服务(如互动导航、互动多媒体服务等),车载设备一般具有大尺寸显示屏,其能够用于显示所获取的增值服务,如播放影音视频,定制的音乐、广播、小品、相声、评书等,或者用于显示实时导航路线图。
在现有技术中,用户如果需要将同一个号码既用在手机移动终端,又可用在车载设备的同时通信,则用户需要将首先将SIM卡从手机等移动终端中取出,然后安装到车载设备中才可以使车载设备从无线网络运营商获取增值服务,而当用户需要用手机等移动终端进行语音通话时,还需要再将SIM卡安装回移动终端,使得用户的操作复杂,进行车载服务的用户体验不好,这将造成用户的使用变得不方便;如果车载设备同时集成3G模块,则很难解决多种天线信号之间的串扰问题,同时使用多个3G网络也会使得用户必须要购买多个网络通信许可,这样会导致用户的上网费用成倍增加。
发明内容
本发明的实施例提供一种基于语音命令控制的车载服务方***及方法,简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验。该***具有一车载映射显示设备,如具有无线接收发送模块的显示装置,其也可以是具有液晶显示屏的平板电脑。
该车载映射显示设备可以通过多种无线环境(包括但不限于WiFi、WiMax、蓝牙以及其他私有无线协议)与手机关联,可以通过公开或加密数据流,以实现定义好的通信协议与手机进行通信。手机中具有一控制单元,其用于将手机屏幕信息、音频信息和数据控制信息发往该车载映射显示设备,该车载映射显示设备的通信模块可以通过无线网络获取这些数据,并通过预定的通信协议进行解码,可将手机屏幕信息实时显示、将手机音频流进行播放并可获得手机终端发出的控制信息以进行响应,如设备状态控制等。同时,该车载映射显示设备也有一些按钮或触摸屏反馈区域,通过这些按钮或触摸屏反馈区域该车载映射显示设备还可以通过无线网络反向发送控制信息给事先连接的手机终端,对其发送控制指令信号,手机端获取这些信号,并通过预先定义的通信控制协议也可以进行状态变换,如播放内容时的暂停、继续、快进、快退以及控制手机进行呼叫等。该车载映射显示设备还可以加装麦克风,通过麦克风可以将说话者信息采集,并通过无线网络传递给手机,手机可以对其进行处理,如语音识别、发送到指定远端设备、语音通话等。
该车载映射显示设备主要用于将手机导航、多媒体交互信息等增值服务进行映射,并反向操作手机,其具有如下优点:(1)避免了在驾驶时对手机的复杂操作(尽管在行车过程中应禁止手机操作或禁止其他一切不符合安全驾驶的动作,但在驾驶过程中会不可避免地出现需要对手机操作的特殊情况),驾驶人员只需要对该车载映射显示设备进行相应的操作即可,其所有的操作会映射到手机中,由于该车载映射显示设备具有大尺寸显示屏,使得其操作方便,减少误操作的几率,实现了安全驾车行驶;(2)驾驶人员在非驾驶过程中,如停车等人、在车中休息等情况下,可以使用该车载映射显示设备进行多种操作如游戏、看电影、听音乐、娱乐上网或者处理公司业务,其相当于一个移动电脑,通过手机于外界进行实时沟通,实现了异地办公;(3)方便地做到了一卡双设备应用,实现一个手机就能“上车给车用,下车给人用”的理念,当驾驶人员上车后,只需要将手机设置为与该车载映射显示设备连接状态即可,而手机可以随身携带而不必固定在驾驶人员可视的位置,只需要将该车载映射显示设备固定在驾驶人员便于目视到的位置即可,如通过车架吸附到前挡风玻璃上。等下车后,驾驶人员只需要关闭该连接状态后就可以直接离开,而不需要将手机SIM卡多次从不同的设备中插拔,从而也延长了SIM的使用寿命,且使得驾驶人员使用该***变得更加简单便捷。
为达到上述目标,本发明的实施例采用如下技术方案:
一种基于语音命令控制的车载服务***,包括一键式控制装置、终端设备、云计算平台服务器、显示设备,其特征在于:
所述一键式控制装置,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接;
所述终端设备,用于与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;接收所述云计算平台服务器发送的第一语音提示信息,向用户播放该第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给所述云计算平台服务器;接收所述用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给所述云计算平台服务器;接收所述云计算平台服务器发送的增值服务控制信息,根据该增值服务控制信息启动对应的增值服务,与提供所述增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置;
所述云计算平台服务器,包括非特定人语音识别模块,所述云计算平台服务器用于向所述终端设备发送所述第一语音提示信息,所述第一语音提示信息用于指示用户输入增值服务类型;接收所述终端设备发送的启动增值服务的语音命令,通过所述非特定人语音识别模块对所述启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务;接收所述终端设备发送的增值服务语音指示命令,通过所述非特定人语音识别模块对所述增值服务语音指示命令进行解析,获取所述增值服务相关的指示信息,根据所述增值服务相关的指示信息生成增值服务控制信息;采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给所述终端设备;
所述显示装置,用于通过无线通信方式与所述终端设备建立通信连接,接收并显示所述终端设备发送的增值服务数据。
一种基于语音命令控制的车载服务方法,包括:
在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部件上,所述一键式控制装置通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接;
所述终端设备通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;
所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入增值服务类型;
所述终端设备向所述用户播放所述第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术对所述启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务;
所述终端设备接收所述用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术对所述增值服务语音指示命令进行解析,获取所述增值服务相关的指示信息,根据所述增值服务相关的指示信息生成增值服务控制信息,采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给所述终端设备;
所述终端设备根据该增值服务控制信息启动对应的增值服务,与提供所述增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置;
所述显示装置显示所述终端设备发送的增值服务数据。
本发明实施例提供的基于语音命令控制的车载服务***和方法,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的,实现了在行车过程中基本上不必再进行任何手动操作,而仅仅通过语音命令进行控制。由于云计算平台服务器能够采用非特定人语音识别技术对终端设备发送的语音命令进行解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,而且其还适用于不同方言的识别,如粤语、闽南语等,同时该***还适用于主流外语的识别,如英语、法语、德语、日语等,并且该***还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语句语音命令中同时使用了中文和英文时,该***能够自动识别出该语音命令中的中文和英文,并形成正确的语音命令。因此上述优点使得该***进一步提高了车载服务的用户体验,使得不同地区的用户使用其方言即可对该***进行操作,这对于那些普通话不太标准的用户来说是特别有利的;由于该***可以允许用户的语音命令中同时使用中英文,这对于那些文化层次较高的白领阶层是非常有利的,特别是对于那些具备多种语言交流能力的用户来说,由于他们经常在中文中中夹杂英语或日语等,***的这种自动识别不同语言的功能使得他们并不需要将不熟悉的日语或英语转换成相应的中文命令,大大方便了用户的使用,同时也提高了该***的工作效率。由于驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制获取增值服务,并且终端设备可以将获取的增值服务数据通过车辆上的显示装置显示,使得驾驶员不需要分散注意力去操作终端设备,降低了驾车过程中的危险性。由于该显示设备能够将终端设备上的信息映射到该显示设备上,使得用户/驾驶员在休息或中途停车中通过该显示设备来对终端设备进行任何操作,使得该***可以作为一个移动电脑进行使用,一方面使得驾驶员能够放松心情得到娱乐,同时由于该***具备了上网功能,使得驾驶员随时随地能够通过该***与外界进行联系,使得驾驶路途不再乏味。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于语音命令控制的车载服务***结构示意图;
图2为本发明实施例提供的基于语音命令控制的车载服务方法流程图一;
图3为图2所示的本发明实施例提供的基于语音命令控制的车载服务方法中205的流程图;
图4为本发明实施例提供的基于语音命令控制的车载服务方法流程图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决用户进行车载服务的操作步骤复杂,车载服务体验差的问题,本发明实施例提供一种基于语音命令控制的车载服务***和方法。
如图1所示,本发明实施例提供的基于语音命令控制的车载服务***,包括:一键式控制装置101、终端设备102、云计算平台服务器103和显示装置104;
其中,一键式控制装置101,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备102建立连接,并通过直接或短距离通信方式驱动终端设备102与云计算平台服务器103建立连接;
为了便于用户操作,作为优选的实施例,车辆的固定部件具体为方向盘,然而,在实际的使用过程中,本发明并不对车辆的固定部件做限定,车辆的固定部件还可以为车辆上其他便于用户触摸的部件,此处不作一一赘述。
在本实施例中,终端设备可以为手机或者PDA,在实际的使用过程中,终端设备还可以为其他能够进行无线通信,并从无线网络运营商处获取增值服务的设备。
在本实施例中,短距离通信方式可以是WiFi、WiMax、蓝牙、红外以及其他私有无线协议。
终端设备102,用于与一键式控制装置101建立连接以后,通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器103建立语音会话连接;接收云计算平台服务器103发送的第一语音提示信息,向用户播放该第一语音提示信息,接收用户根据第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给云计算平台服务器103;接收用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给云计算平台服务器103;接收云计算平台服务器103发送的增值服务控制信息,根据该增值服务控制信息启动对应的增值服务,与提供所述增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置104;
在本实施例中,增值服务可以包括但不限于导航服务以及视音频播放服务等。如果增值服务为导航服务,增值服务语音指示命令具体为目的导航地址的语音指示命令;如果增值服务为视音频播放服务,增值服务语音指示命令具体为包含目的视音频描述信息的语音指示命令,例如:包含歌曲或者视频节目名称的语音指示信息,或者包含歌手名字的语音指示信息等,此处不作一一赘述。
云计算平台服务器103,包括非特定人语音识别模块,云计算平台服务器103用于向终端设备102发送第一语音提示信息,该第一语音提示信息用于指示用户输入增值服务类型;接收终端设备102发送的启动增值服务的语音命令,通过非特定人语音识别模块对启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务;接收终端设备102发送的增值服务语音指示命令,通过非特定人语音识别模块对该增值服务语音指示命令进行解析,获取该增值服务相关的指示信息,根据所述增值服务相关的指示信息生成增值服务控制信息;采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给终端设备102。
显示装置104,用于通过无线通信方式与终端设备102建立通信连接,接收并显示终端设备102发送的增值服务数据。
例如:当增值服务为导航服务时,显示装置104接收并显示终端设备102从导航服务器获取的导航信息(行车路线等);当增值服务为视音频播放服务时,显示装置104接收并显示终端设备102从视频服务器获取的视频图像,或者接收并显示终端设备102从音频服务器获取的歌曲的歌词等。
在本实施例中,显示装置104可以通过多种无线环境(包括但不限于WiFi、WiMax、蓝牙以及其他私有无线协议)与终端设备102关联,并可以通过公开或加密数据流,以实现定义好的通信协议与终端设备102进行通信。
进一步地,在本实施例中,云计算平台服务器103上预先存储有多种广谱语音特征库,例如:按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。非特定人语音识别模块具体用于对启动增值服务的语音命令进行解析,提取第一语音特征信息,根据该第一语音特征信息查找第一广谱语音特征库,获取与该第一语音特征信息对应的启动增值服务命令;以及,具体用于对增值服务语音指示命令进行解析,提取第二语音特征信息,根据该第二语音特征信息查找第二广谱语音特征库,获取与该第二语音特征信息对应的增值服务相关的指示信息。
其中,所述第一广谱语音特征库中具有与所属第一语音特征信息对应的第一广谱语音特征信息,所述第二广谱语音特征库中具有与所属第二语音特征信息对应的第二广谱语音特征信息。
其中,上述第一和第二语音特征信息包括语音命令的频谱分布信息、时域波形信息、语音帧短时谱、共振峰频率及带宽、鼻音联合特征、谱相关特征、音调特征、功率谱、帧能量、语音强度及其变化轨迹特征灯,另外第一和第二语音特征信息也可以是使用上述多种特征信息中的一个或多个的组合。
例如:当增值服务为导航服务时,非特定人语音识别模块对启动导航服务的语音命令进行解析,提取对应的第一语音特征信息(如频谱分布信息等),根据该第一语音特征信息查找根据启动命令关键词设置的广谱语音特征库,从中获取该第一语音特征信息对应的启动导航服务命令;非特定人语音识别模块对目的导航地址的语音指示命令进行解析,提取对应的第二语音特征信息(如频谱分布信息等),根据该第二语音特征信息查找根据地名设置的广谱语音特征库,从中获取该第二语音特征信息对应的目的导航地址。
其中,更进一步地,上述导航服务的优选方式还可为:当用户选择该***的增值服务为导航服务时,用户发出语音命令(如“我要导航”),非特定人语音识别模块对启动导航服务的语音命令(如“我要导航”)进行解析,提取对应的第一语音特征信息(如该语音命令“我要导航”的频谱分布信息等),根据提取的该第一语音特征信息查找根据启动命令关键词设置的广谱语音特征库,从该根据启动命令关键词设置的广谱语音特征库中获取该第一语音特征信息对应的启动导航服务命令(如“我要导航”),从而进一步根据该识别出(即获取)的语音命令(如“我要导航”)启动对应的导航服务;导航服务启动后,非特定人语音识别模块对目的导航地址的语音指示命令(如“海龙大厦”)进行解析,提取与该语音指示命令(如“海龙大厦”)对应的第二语音特征信息(如频谱分布信息等),根据该第二语音特征信息查找根据地名设置的广谱语音特征库,从该根据地名设置的广谱语音特征库中获取该第二语音特征信息对应的地名(如“海龙大厦”),然后根据该识别出的地名获得该地名所对应的导航地址(如“海龙大厦”所在的地址)。
又如:当增值服务为视音频点播服务时,非特定人语音识别模块对启动视音频点播服务的语音命令进行解析,提取对应的第一语音特征信息(如频谱分布信息等),根据该第一语音特征信息查找根据启动命令关键词设置的广谱语音特征库,从中获取该第一语音特征信息对应的启动导航服务命令;非特定人语音识别模块对包含目的视音频描述信息的语音指示命令进行解析,提取对应的第二语音特征信息(如频谱分布信息等),根据该第二语音特征信息查找根据视音频描述信息设置的广谱语音特征库,从中获取该第二语音特征信息对应的视音频描述信息。
其中,更进一步地,上述视音频点播服务服务的优选方式还可为:当用户所选的增值服务为视音频点播服务时,用户发出语音命令后(如“观看视频”),非特定人语音识别模块对启动视音频点播服务的语音命令(如“观看视频”)进行解析,提取与该视音频点播服务的语音命令(如“观看视频”)对应的第一语音特征信息(如频谱分布信息等),根据该第一语音特征信息查找根据启动命令关键词设置的广谱语音特征库,从该根据启动命令关键词设置的广谱语音特征库中获取与该第一语音特征信息对应的启动视音频点播服务命令(如“观看视频”),从而启动对应的视音频点播服务;当视音频点播服务启动后,非特定人语音识别模块对包含目的视音频描述信息(如“山楂树之恋”)的语音指示命令进行解析,提取与该语音指示命令(如“山楂树之恋”)对应的第二语音特征信息(如频谱分布信息等),根据该第二语音特征信息查找根据视音频描述信息设置的广谱语音特征库,从该根据视音频描述信息设置的广谱语音特征库中获取该第二语音特征信息对应的视音频描述信息(如“山楂树之恋”),然后获得与其所对应的服务信息(如可播放的电影“山楂树之恋”)。
需要说明的是,本实施例提供的广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境下(不同噪音背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。其优点在于:(1)该广谱语音特征库的所选样本广泛,包括世界上不同国家的不同地区的人的发音。例如,在中国,选取了全国几乎每个省县镇地区的人的发音,并对全国不同地区的人划分为几大类,如华北地区、东北地区、闽南语地区、粤语地区等,这些不同地区的人所说的普通话带有地方方言,其特征各不相同,将他们分别归类后,将地方方言发音基本相似的地区的人归为一类,这样既考虑了样本的完备性也兼顾了构建数据库产生尽可能少的冗余信息;(2)对不同环境(噪音背景)下的声音或语音命令进行了提取其语音特征信息,如在汽车发动机发动后所产生的语音命令,当汽车窗户打开后产生风燥和胎噪下所产生的语音命令,在旁人突然插话等干扰情况下所产生的语音命令,在发动机关闭后所产生的语音命令等;(3)该广谱语音特征库包括普通话特征库和地方方言特征库,其中地方方言特征库包括闽南语库、粤语库、上海话库等。
上述第一和/或第二语音特征信息中已经考虑了至少上述多种情况下的至少一种,如考虑了不同地区的人的情况或不同环境下的情况等,即上述第一和/或第二语音特征信息是基于不同地区的人的声音或语音命令所提取的语音特征信息,或上述第一和/或第二语音特征信息是基于处于不同环境下的人的声音或语音命令所提取的语音特征信息。这样提高了对不同地区的用户或驾驶员的语音命令的识别率。
进一步地,该广谱语音特征库还包括外语特征库,其中该外语特征库中具有英语库、法语库、德语库、日语库等主流国外语言库。该***还具有一特征库自动识别模块,其用于对用户所发出的语音命令进行分析辨别该语音命令所对应的特征库,并自动选择相对应的特征库。从而使得用户可以混合使用不同国家的语言发出语音命令,这些语言可以不经事先筛选来混合使用,该库特征库自动识别模块会自动识别出该语音命令到底是中文还是外语。
通过将上述所建立的广谱语音特征库设置在上述云计算平台服务器中的优点在于,降低了对终端设备的***的依赖性,将说话者面前的终端设备当作一种声音或语音命令的采集设备,将采集到的声音或语音命令的数据传输到后台服务器群如云计算平台服务器去识别,这样既可发挥多服务器集群架构下的高性能识别计算,同时也可以使用上述大规模的语音特征库,而不需要终端设备具备语音识别能力。
在本实施例中,通过非特定人语音识别模块可以识别出95%的语音信息,为了保证能够100%识别出用户的语音信息,进一步提高车载服务的用户体验,可选地,如图1所示,云计算平台服务器103还可以包括非特定人语音识别人工坐席模块,该非特定人语音识别人工坐席模块,用于当非特定人语音识别模块无法识别启动增值服务的语音命令时,对该启动增值服务的语音命令进行识别,获取对应的启动增值服务命令,和/或,用于当非特定人语音识别模块无法识别增值服务语音指示命令时,对该增值服务语音指示命令进行识别,获取所述增值服务相关的指示信息。
本发明实施例提供的基于语音命令控制的车载服务***,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的。由于云计算平台服务器能够通过非特定人语音识别模块对终端设备发送的语音命令进行解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同地区,具有不同语音、地方方言的用户使用,进一步提高了车载服务的用户体验。由于驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制获取增值服务,并且终端设备可以将获取的增值服务数据通过车辆上的显示装置显示,使得驾驶员不需要分散注意力去操作终端设备,降低了驾车过程中的危险性。
本发明另一实施例还提供一种基于语音命令控制的车载服务***,该***与如图1所示的基于语音命令控制的车载服务***基本相同,其区别在于,本实施例提供的基于语音命令控制的车载服务***,云计算平台服务器103,还可以用于通过语音会话连接向终端设备102发送第二语音提示信息,该第二语音提示信息用于指示用户输入增值服务语音指示命令;终端设备102,还可以用于向用户播放第二语音提示信息。
本发明实施例提供的基于语音命令控制的车载服务***,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的。由于云计算平台服务器能够通过非特定人语音识别模块对终端设备发送的语音命令进行解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同地区,具有不同语音、音调的用户使用,进一步提高了车载服务的用户体验。由于驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制获取增值服务,并且终端设备可以将获取的增值服务数据通过车辆上的显示装置显示,使得驾驶员不需要分散注意力去操作终端设备,降低了驾车过程中的危险性。进一步地,由于云计算平台服务器通过终端设备向用户发送第二语音提示信息,使得用户可以根据该第二语音提示信息发送增值服务语音指示命令,避免了由于出现通信故障(如信道阻塞造成云计算平台服务器没有接收到用户发送的启动增值服务的语音命令)而造成云计算平台服务器信息处理错误,整个基于语音命令控制的车载服务***瘫痪的问题,进而提高了基于语音命令控制的车载服务***的可靠性,保障了车载服务的用户体验。
本发明又一实施例还提供一种基于语音命令控制的车载服务***,该***与如图1所示的基于语音命令控制的车载服务***基本相同,其区别在于,本实施例提供的基于语音命令控制的车载服务***,云计算平台服务器103还可以用于对终端设备102进行验证,云计算平台服务器将从终端设备中所得到的启动增值服务的语音命令重新反馈给用户,并提示用户进行确认,当得到用户的肯定答复后才执行该发送的语音命令;当得到用户的否定答复后,云计算平台服务器重新发送该语音命令,并进行有限次循环后依然得不到用户的肯定答复时,该***转向非特定人语音识别人工坐席模块,使用该人工坐席模块对该启动增值服务的语音命令进行识别。该有限次循环可以为1次或者更多次。
本发明实施例提供的基于语音命令控制的车载服务***,在简化用户操作,提高车载服务的用户体验基础上,进一步可以对终端设备进行验证,从而保证了基于语音命令控制的车载服务***的安全性和可靠性。
本发明再一实施例还提供一种基于语音命令控制的车载服务***,该***与如图1所示的基于语音命令控制的车载服务***基本相同,其区别在于:终端设备102还可以用于通过无线通信方式对显示装置104的工作状态进行连接并进行控制其信息显示等。
进一步地,显示装置104可以包括按键区域和/或触摸屏反馈区域,所述显示装置104还可以用于通过按键区域和/或触摸屏反馈区域接收用户的操作指令,将该操作指令发送给终端设备102,接收并显示终端设备102发送的增值服务更新数据;终端设备102,还可以用于接收显示装置102发送的操作指令,根据该操作指令从提供增值服务的服务器获取增值服务更新数据,将该增值服务更新数据或者该终端设备根据该更新数据所更新的实时图像实时发送给显示装置104。
例如:当增值服务为视频播放服务,增值服务数据为视频流数据时,显示装置104可以从过按键区域和/或触摸屏反馈区域接收用户发送的快进或者快退操作指令,将该操作指令发送给终端设备102,终端设备102根据该操作指令向视频服务器获取快进或者快退时间点以后的视频流数据,并将该视频流数据发送给显示装置104进行显示。
本发明再一实施例提供的基于语音命令控制的车载服务***,在图1所示方案达到的有益效果基础上,显示装置和终端设备之间可以进行互操作,从而使得用户进行车载服务的操作更加简单方便,提高了用户进行车载服务的体验,并且由于简化了车载服务操作,进一步保障了驾驶员的行车安全。
如图2所示,本发明实施例还提供一种基于语音命令控制的车载服务方法,其特征在于,包括:
201、在用户按下一键式控制装置的启动键以后,一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,一键式控制装置设置在车辆的固定部件上,一键式控制装置通过直接或短距离通信方式驱动终端设备与云计算平台服务器建立连接。
为了便于用户操作,作为优选的实施例,车辆的固定部件具体为方向盘,然而,在实际的使用过程中,本发明并不对车辆的固定部件做限定,车辆的固定部件还可以为车辆上其他便于用户触摸的部件,此处不作一一赘述。
在本实施例中,终端设备可以为手机或者PDA,在实际的使用过程中,终端设备还可以为其他能够进行无线通信,并从无线网络运营商处获取增值服务的设备。
在本实施例中,短距离通信方式可以是WiFi、WiMax、蓝牙、红外以及其他私有无线协议。
202、终端设备通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接。
203、云计算平台服务器通过语音会话连接向终端设备发送第一语音提示信息,所述第一语音提示信息用于指示用户输入增值服务类型。
在本实施例中,增值服务类型可以包括但不限于:导航服务以及视音频播放服务等。
204、终端设备向用户播放第一语音提示信息,接收用户根据第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给云计算平台服务器。
205、云计算平台服务器采用非特定人语音识别技术对启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务。
具体地,如图3所示,205可以包括:
2051、云计算平台服务器对所述启动增值服务的语音命令进行解析,提取第一语音特征信息;
2052、云计算平台服务器根据第一语音特征信息查找第一广谱语音特征库,从第一广谱语音特征库中获取与所述第一语音特征信息对应的启动增值服务命令。
206、终端设备接收用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给云计算平台服务器。
在本实施例中,如果增值服务为导航服务,增值服务语音指示命令具体为目的导航地址的语音指示命令;如果增值服务为视音频播放服务,增值服务语音指示命令具体为包含目的视音频描述信息的语音指示命令,例如:包含歌曲或者视频节目名称的语音指示信息,或者包含歌手名字的语音指示信息等,此处不作一一赘述。
207、云计算平台服务器采用非特定人语音识别技术对增值服务语音指示命令进行解析,获取增值服务相关的指示信息,根据所述增值服务相关的指示信息生成增值服务控制信息,采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给所述终端设备。
本步骤中云计算平台服务器采用非特定人语音识别技术对增值服务语音指示命令进行解析,获取增值服务相关的指示信息的步骤可以包括:云计算平台服务器对增值服务语音指示命令进行解析,提取第二语音特征信息,根据第二语音特征信息查找第二广谱语音特征库,从该第二广谱语音特征库中获取与所述第二语音特征信息对应的增值服务相关的指示信息。
其中,上述第一和第二语音特征信息包括语音命令的频谱分布信息、时域波形信息、语音帧短时谱、共振峰频率及带宽、鼻音联合特征、谱相关特征、音调特征、功率谱、帧能量、语音强度及其变化轨迹特征灯,另外第一和第二语音特征信息也可以是使用上述多种特征信息中的一个或多个的组合。
208、终端设备根据该增值服务控制信息启动对应的增值服务,与提供增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置。
209、显示装置显示终端设备发送的增值服务数据。
需要说明的是,本实施例提供的广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境下(不同噪音背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。
其优点在于:(1)该广谱语音特征库的所选样本广泛,包括世界上不同国家的不同地区的人的发音。例如,在中国,选取了全国几乎每个省县镇地区的人的发音,并对全国不同地区的人划分为几大类,如华北地区、东北地区、闽南语地区、粤语地区等,这些不同地区的人所说的普通话带有地方方言,其特征各不相同,将他们分别归类后,将地方方言发音基本相似的地区的人归为一类,这样既考虑了样本的完备性也兼顾了构建数据库产生尽可能少的冗余信息;(2)对不同环境(噪音背景)下的声音或语音命令进行了提取其语音特征信息,如在汽车发动机发动后所产生的语音命令,当汽车窗户打开后产生风燥和胎噪下所产生的语音命令,在旁人突然插话等干扰情况下所产生的语音命令,在发动机关闭后所产生的语音命令等;(3)该广谱语音特征库包括普通话特征库和地方方言特征库,其中地方方言特征库包括闽南语库、粤语库、上海话库等。
进一步地,该广谱语音特征库还包括外语特征库,其中该外语特征库中具有英语库、法语库、德语库、日语库等主流国外语言库。该***还具有一特征库自动识别模块,其用于对用户所发出的语音命令进行分析辨别该语音命令所对应的特征库,并自动选择相对应的特征库。从而使得用户可以混合使用不同国家的语言发出语音命令,这些语言可以不经事先筛选来混合使用,该库特征库自动识别模块会自动识别出该语音命令到底是中文还是外语。
上述第一和/或第二语音特征信息中已经考虑了至少上述多种情况下的至少一种,如考虑了不同地区的人的情况或不同环境下的情况等,即上述第一和/或第二语音特征信息是基于不同地区的人的声音或语音命令所提取的语音特征信息,或上述第一和/或第二语音特征信息是基于处于不同环境下的人的声音或语音命令所提取的语音特征信息。这样提高了对不同地区的用户或驾驶员的语音命令的识别率。
在本实施例中,通过非特定人语音识别技术可以识别出95%的语音信息,为了保证能够100%识别出用户的语音信息,进一步提高车载服务的用户体验,可选地,本发明实施例提供的基于语音命令控制的车载服务方法,还可以包括:
当云计算平台服务器无法通过非特定人语音识别技术识别所述启动增值服务的语音命令时,云计算平台服务器通过非特定人语音识别人工坐席模块对该启动增值服务的语音命令进行识别,获取对应的启动增值服务命令,和/或,
当云计算平台服务器无法通过非特定人语音识别技术识别增值服务语音指示命令时,云计算平台服务器通过非特定人语音识别人工坐席模块对该增值服务语音指示命令进行识别,获取增值服务相关的指示信息。
本发明实施例提供的基于语音命令控制的车载服务方法具体实现可以参见如图1所示的本发明实施例提供的基于语音命令控制的车载服务***所述,此处不再赘述。
本发明实施例提供的基于语音命令控制的车载服务方法,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的。由于云计算平台服务器能够通过非特定人语音识别模块对终端设备发送的语音命令进行解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同地区,具有不同语音、音调的用户使用,进一步提高了车载服务的用户体验。由于驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制获取增值服务,并且终端设备可以将获取的增值服务数据通过车辆上的显示装置显示,使得驾驶员不需要分散注意力去操作终端设备,降低了驾车过程中的危险性。
本发明另一实施例还提供一种基于语音命令控制的车载服务方法,该方法与如图2所示的基于语音命令控制的车载服务方法基本相同,其区别在于,如图4所示,在205之后,206之前,还可以包括:
210、云计算平台服务器通过语音会话连接箱所述终端设备发送第二语音提示信息,第二语音提示信息用于指示所述用户输入增值服务语音指示命令;
211、终端设备向用户播放所述第二语音提示信息。
本发明实施例提供的基于语音命令控制的车载服务方法,用户只需按下设置的车辆的固定部件上的一键式控制装置的启动键,即可通过该一键式控制装置将终端设备和网络侧的云计算平台服务器建立连接,通过语音控制方式获取增值服务,并将该增值服务数据发送至显示装置显示,达到了简化了用户进行车载服务的操作步骤,提高了车载服务的用户体验的目的。由于云计算平台服务器能够通过非特定人语音识别模块对终端设备发送的语音命令进行解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同地区,具有不同语音、音调的用户使用,进一步提高了车载服务的用户体验。由于驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制获取增值服务,并且终端设备可以将获取的增值服务数据通过车辆上的显示装置显示,使得驾驶员不需要分散注意力去操作终端设备,降低了驾车过程中的危险性。进一步地,由于云计算平台服务器通过终端设备向用户发送第二语音提示信息,使得用户可以根据该第二语音提示信息发送增值服务语音指示命令,避免了由于出现通信故障(如信道阻塞造成云计算平台服务器没有接收到用户发送的启动增值服务的语音命令)而造成云计算平台服务器信息处理错误,整个基于语音命令控制的车载服务***瘫痪的问题,进而提高了基于语音命令控制的车载服务***的可靠性,保障了车载服务的用户体验。
本发明又一实施例还提供一种基于语音命令控制的车载服务方法,该方法与如图2所示的基于语音命令控制的车载服务方法基本相同,其区别在于,在202之后,203之前,还可以包括:云计算平台服务器对所述终端设备进行验证。则此时,203为:当验证通过时,云计算平台服务器通过语音会话连接向所述终端设备发送第一语音提示信息。
本发明实施例提供的基于语音命令控制的车载服务方法,在简化用户操作,提高车载服务的用户体验基础上,进一步可以对终端设备进行验证,从而保证了基于语音命令控制的车载服务方法的安全性和可靠性。
本发明再一实施例还提供一种基于语音命令控制的车载服务方法,该方法与如图2所示的基于语音命令控制的车载服务方法基本相同,其区别在于:本实施例提供的基于语音命令控制的车载服务方法还可以包括:终端设备通过无线通信方式对显示装置的工作状态进行控制的步骤。
进一步地,本实施例提供的基于语音命令控制的车载服务方法还还包括:显示装置通过按键区域和/或触摸屏反馈区域接收用户的操作指令,将该操作指令发送给所述终端设备;终端设备根据所述操作指令从提供所述增值服务的服务器获取增值服务更新数据,将该增值服务更新数据或者该终端设备根据该更新数据所更新的实时图像实时发送给所述显示装置;以及显示装置显示所述增值服务更新数据的步骤。
本发明再一实施例提供的基于语音命令控制的车载服务方法,在图2所示方案达到的有益效果基础上,显示装置和终端设备之间可以进行互操作,从而使得用户进行车载服务的操作更加简单方便,提高了用户进行车载服务的体验,并且由于简化了车载服务操作,进一步保障了驾驶员的行车安全。
本发明实施例提供的基于语音命令控制的车载服务***和方法,可以应用在汽车等交通工具中,实现在行车过程中获取车载服务的目的。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (40)

1.一种基于语音命令控制的车载服务***,包括一键式控制装置、终端设备、云计算平台服务器和显示装置,其特征在于: 
所述一键式控制装置,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接,其中,所述启动键设置在所述一键式控制装置上; 
所述终端设备,用于与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;接收所述云计算平台服务器发送的第一语音提示信息,向用户播放该第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给所述云计算平台服务器;接收所述用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给所述云计算平台服务器;接收所述云计算平台服务器发送的增值服务控制信息,根据该增值服务控制信息启动对应的增值服务,与提供所述增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置; 
所述云计算平台服务器,包括非特定人语音识别模块,所述云计算平台服务器用于向所述终端设备发送所述第一语音提示信息,所述第一语音提示信息用于指示用户输入增值服务类型;接收所述终端设备发送的启动增值服务的语音命令,通过所述非特定人语音识别模块对所述启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务;接收所述终端设备发送的增值服务语音指示命令,通过所述非特定人语音识别模块对所述增值服务语音指示命令进行解析,获取所述增值服务相关的指示信息,根据所述增值服务相关的指示信息生成增值服务控制信息;采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给所述终端设备; 
所述显示装置,用于通过无线通信方式与所述终端设备建立通信连接,接收并显示所述终端设备发送的增值服务数据。 
2.根据权利要求1所述的***,其特征在于,所述非特定人语音识别模块 具体用于对所述启动增值服务的语音命令进行解析,提取第一语音特征信息,根据该第一语音特征信息查找第一广谱语音特征库,获取与所述第一语音特征信息对应的启动增值服务命令,以及, 
具体用于对所述增值服务语音指示命令进行解析,提取第二语音特征信息,根据该第二语音特征信息查找第二广谱语音特征库,获取与所述第二语音特征信息对应的增值服务相关的指示信息。 
3.根据权利要求1所述的***,其特征在于,所述云计算平台服务器还包括非特定人语音识别人工坐席模块; 
所述非特定人语音识别人工坐席模块,用于当所述非特定人语音识别模块无法识别所述启动增值服务的语音命令时,对该启动增值服务的语音命令进行识别,获取对应的启动增值服务命令,和/或, 
用于当所述非特定人语音识别模块无法识别所述增值服务语音指示命令时,对该增值服务语音指示命令进行识别,获取所述增值服务相关的指示信息。 
4.根据权利要求1所述的***,其特征在于, 
所述云计算平台服务器,还用于通过所述语音会话连接向所述终端设备发送第二语音提示信息,所述第二语音提示信息用于指示所述用户输入增值服务语音指示命令; 
所述终端设备,还用于向所述用户播放所述第二语音提示信息。 
5.根据权利要求1所述的***,其特征在于,所述云计算平台服务器,还用于对所述终端设备进行验证。 
6.根据权利要求1所述的***,其特征在于,所述终端设备,还用于通过无线通信方式对所述显示装置的工作状态进行控制。 
7.根据权利要求1所述的***,其特征在于, 
所述显示装置,包括按键区域和/或触摸屏反馈区域,所述显示装置还用于通过所述按键区域和/或触摸屏反馈区域接收用户的操作指令,将所述操作指令发送给所述终端设备,接收并显示所述终端设备发送的增值服务更新数据; 
所述终端设备,还用于接收所述显示装置发送的操作指令,根据该操作指令从提供所述增值服务的服务器获取增值服务更新数据,将该增值服务更新数 据或者该终端设备根据该更新数据所更新的实时图像实时发送给所述显示装置。 
8.根据权利要求1-7任意一项所述的***,其特征在于,所述终端设备为手机或者PDA。 
9.根据权利要求1-7任意一项所述的***,其特征在于,所述车辆的固定部件为方向盘。 
10.根据权利要求1-7任意一项所述的***,其特征在于,所述短距离通信方式为WiFi、WiMax、蓝牙、红外以及其他私有无线协议。 
11.根据权利要求1-7任意一项所述的***,其特征在于,所述显示装置与所述终端设备所建立连接所用的无线通信方式为WiFi、WiMax、蓝牙、红外以及其他私有无线协议。 
12.根据权利要求2所述的***,其特征在于,所述云计算平台服务器进一步包括第一广谱语音特征库和第二广谱语音特征库,所述第一广谱语音特征库中具有与所述第一语音特征信息对应的第一广谱语音特征信息,所述第二广谱语音特征库中具有与所述第二语音特征信息对应的第二广谱语音特征信息。 
13.根据权利要求2所述的***,其特征在于,所述第一和/或第二广谱语音特征库包括普通话特征库和地方方言特征库。 
14.根据权利要求13所述的***,其特征在于,其中地方方言特征库包括闽南语库、粤语库、上海话库。 
15.根据权利要求1-7任意一项所述的***,所述云计算平台服务器还用于对终端设备进行验证,云计算平台服务器将从终端设备中所得到的启动增值服务的语音命令重新反馈给用户,并提示用户进行确认,当得到用户的肯定答复后才执行该发送的语音命令。 
16.根据权利要求1-7任意一项所述的***,所述云计算平台服务器还用于对终端设备进行验证,云计算平台服务器将从终端设备中所得到的启动增值服务的语音命令重新反馈给用户,并提示用户进行确认,当得到用户的否定答复后,云计算平台服务器重新发送该语音命令,并进行有限次循环后依然得不到用户的肯定答复时,该***转向非特定人语音识别人工坐席模块,使用该人工 坐席模块对该启动增值服务的语音命令进行识别。 
17.根据权利要求16所述的***,其特征在于,该有限次循环为1次以上。 
18.根据权利要求13所述的***,其特征在于,所述第一和/或第二广谱语音特征库还包括外语特征库。 
19.根据权利要求18所述的***,其特征在于,该外语特征库中具有主流国外语言库,所述主流国外语言库包括:英语库、法语库、德语库、日语库。 
20.根据权利要求18所述的***,其特征在于,该***还具有一特征库自动识别模块,其用于对用户所发出的语音命令进行分析辨别该语音命令所对应的特征库,并自动选择相对应的特征库。 
21.一种基于语音命令控制的车载服务方法,其特征在于,包括: 
在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部件上,所述一键式控制装置通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接; 
所述终端设备通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接; 
所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入增值服务类型; 
所述终端设备向所述用户播放所述第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动增值服务的语音命令,并将该启动增值服务的语音命令发送给所述云计算平台服务器; 
所述云计算平台服务器采用非特定人语音识别技术对所述启动增值服务的语音命令进行解析,获取启动增值服务命令,根据该启动增值服务命令启动对应的增值服务; 
所述终端设备接收所述用户发送的增值服务语音指示命令,并将该增值服务语音指示命令发送给所述云计算平台服务器; 
所述云计算平台服务器采用非特定人语音识别技术对所述增值服务语音指示命令进行解析,获取所述增值服务相关的指示信息,根据所述增值服务相关 的指示信息生成增值服务控制信息,采用短信下发或建立移动数据通道的方式将该增值服务控制信息发送给所述终端设备; 
所述终端设备根据该增值服务控制信息启动对应的增值服务,与提供所述增值服务的服务器建立连接,从该服务器获取增值服务数据,将该增值服务数据通过无线通信方式发送给显示装置; 
所述显示装置显示所述终端设备发送的增值服务数据。 
22.根据权利要求21所述的方法,其特征在于,所述云计算平台服务器采用非特定人语音识别技术对所述启动增值服务的语音命令进行解析,获取启动增值服务命令包括:所述云计算平台服务器对所述启动增值服务的语音命令进行解析,提取第一语音特征信息,根据所述第一语音特征信息查找第一广谱语音特征库,获取与所述第一语音特征信息对应的启动增值服务命令;以及, 
所述云计算平台服务器采用非特定人语音识别技术对所述增值服务语音指示命令进行解析,获取所述增值服务相关的指示信息包括:所述云计算平台服务器对所述增值服务语音指示命令进行解析,提取第二语音特征信息,根据所述第二语音特征信息查找第二广谱语音特征库,获取与所述第二语音特征信息对应的增值服务相关的指示信息。 
23.根据权利要求21所述的方法,其特征在于,还包括: 
当所述云计算平台服务器无法通过非特定人语音识别技术识别所述启动增值服务的语音命令时,所述云计算平台服务器通过非特定人语音识别人工坐席模块对该启动增值服务的语音命令进行识别,获取对应的启动增值服务命令,和/或, 
当所述云计算平台服务器无法通过非特定人语音识别技术识别所述增值服务语音指示命令时,所述云计算平台服务器通过非特定人语音识别人工坐席模块对该增值服务语音指示命令进行识别,获取所述增值服务相关的指示信息。 
24.根据权利要求21所述的方法,其特征在于,还包括: 
所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第二语音提示信息,所述第二语音提示信息用于指示所述用户输入增值服务语音指示命令; 
所述终端设备向所述用户播放所述第二语音提示信息。 
25.根据权利要求21所述的方法,其特征在于,还包括: 
所述云计算平台服务器对所述终端设备进行验证; 
则,当所述验证通过时,所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息。 
26.根据权利要求21所述的方法,其特征在于,还包括: 
所述终端设备通过无线通信方式对所述显示装置的工作状态进行控制。 
27.根据权利要求21所述的方法,其特征在于,还包括: 
所述显示装置通过按键区域和/或触摸屏反馈区域接收用户的操作指令,将该操作指令发送给所述终端设备; 
所述终端设备根据所述操作指令从提供所述增值服务的服务器获取增值服务更新数据,将该增值服务更新数据或者该终端设备根据该更新数据所更新的实时图像实时发送给所述显示装置; 
所述显示装置显示所述增值服务更新数据。 
28.根据权利要求21-27任意一项所述的方法,其特征在于,所述终端设备为手机或者PDA。 
29.根据权利要求21-27任意一项所述的方法,其特征在于,所述车辆的固定部件为方向盘。 
30.根据权利要求21-27任意一项所述的方法,其特征在于,所述短距离通信方式为WiFi、WiMax、蓝牙、红外以及其他私有无线协议。 
31.根据权利要求21-27任意一项所述的方法,其特征在于,所述显示装置与所述终端设备所建立连接所用的无线通信方式为WiFi、WiMax、蓝牙、红外以及其他私有无线协议。 
32.根据权利要求22所述的方法,其特征在于,所述云计算平台服务器进一步包括第一广谱语音特征库和第二广谱语音特征库,所述第一广谱语音特征库中具有与所属第一语音特征信息对应的第一广谱语音特征信息,所述第二广谱语音特征库中具有与所属第二语音特征信息对应的第二广谱语音特征信息。 
33.根据权利要求22所述的方法,其特征在于,所述第一和/或第二广谱语 音特征库包括普通话特征库和地方方言特征库。 
34.根据权利要求30所述的方法,其特征在于,其中地方方言特征库包括闽南语库、粤语库、上海话库。 
35.根据权利要求21-27任意一项所述的方法,所述云计算平台服务器还用于对终端设备进行验证,云计算平台服务器将从终端设备中所得到的启动增值服务的语音命令重新反馈给用户,并提示用户进行确认,当得到用户的肯定答复后才执行该发送的语音命令。 
36.根据权利要求21-27任意一项所述的方法,所述云计算平台服务器还用于对终端设备进行验证,云计算平台服务器将从终端设备中所得到的启动增值服务的语音命令重新反馈给用户,并提示用户进行确认,当得到用户的否定答复后,云计算平台服务器重新发送该语音命令,并进行有限次循环后依然得不到用户的肯定答复时,该云计算平台服务器转向非特定人语音识别人工坐席模块,使用该人工坐席模块对该启动增值服务的语音命令进行识别。 
37.根据权利要求36所述的方法,其特征在于,该有限次循环为1次以上。 
38.根据权利要求33所述的方法,其特征在于,所述第一和/或第二广谱语音特征库还包括外语特征库。 
39.根据权利要求38所述的方法,其特征在于,该外语特征库中具有主流国外语言库,所述主流国外语言库包括:英语库、法语库、德语库、日语库。 
40.根据权利要求38所述的方法,其特征在于,所述云计算平台服务器还具有一特征库自动识别模块,其用于对用户所发出的语音命令进行分析辨别该语音命令所对应的特征库,并自动选择相对应的特征库。 
CN201010556994.7A 2010-11-24 2010-11-24 基于语音命令控制的车载服务***及方法 Active CN102006373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010556994.7A CN102006373B (zh) 2010-11-24 2010-11-24 基于语音命令控制的车载服务***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010556994.7A CN102006373B (zh) 2010-11-24 2010-11-24 基于语音命令控制的车载服务***及方法

Publications (2)

Publication Number Publication Date
CN102006373A CN102006373A (zh) 2011-04-06
CN102006373B true CN102006373B (zh) 2015-01-28

Family

ID=43813437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010556994.7A Active CN102006373B (zh) 2010-11-24 2010-11-24 基于语音命令控制的车载服务***及方法

Country Status (1)

Country Link
CN (1) CN102006373B (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102316361B (zh) * 2011-07-04 2014-05-21 深圳市车音网科技有限公司 基于自然语音识别的音频/视频点播方法和***
CN102347026B (zh) * 2011-07-04 2012-12-05 深圳市车音网科技有限公司 基于自然语音识别的音频、视频或音视频点播方法和***
KR101294553B1 (ko) * 2011-10-13 2013-08-07 기아자동차주식회사 음원정보 관리 서비스 시스템
US9183835B2 (en) * 2011-10-18 2015-11-10 GM Global Technology Operations LLC Speech-based user interface for a mobile device
CN102435202B (zh) * 2011-12-01 2015-03-11 广西卫通汽车信息技术有限公司 云端语音导航的方法和装置
CN103188408A (zh) * 2011-12-29 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音自动应答云端服务器、***及方法
CN103188409A (zh) * 2011-12-29 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音自动应答云端服务器、***及方法
CN103188410A (zh) * 2011-12-29 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音自动应答云端服务器、***及方法
CN103188138B (zh) * 2011-12-30 2017-11-07 上海博泰悦臻电子设备制造有限公司 一种互动消息数据处理***
CN102546829A (zh) * 2012-02-28 2012-07-04 山东超越数控电子有限公司 一种基于车载移动环境的私有云计算***
CN102543083A (zh) * 2012-03-16 2012-07-04 北京海尔集成电路设计有限公司 智能语音识别方法和芯片、云设备以及云服务器
CN103546519B (zh) * 2012-07-17 2017-04-26 中国电信股份有限公司 车载终端、移动终端及业务的应用处理方法、***
CN103632664B (zh) * 2012-08-20 2017-07-25 联想(北京)有限公司 一种语音识别的方法及电子设备
CN103685407A (zh) * 2012-09-18 2014-03-26 高德软件有限公司 一种基于云技术的Telematics平台***
CN103077716A (zh) * 2012-12-31 2013-05-01 威盛电子股份有限公司 辅助启动装置、语音操控***及其方法
CN103167628A (zh) * 2013-02-04 2013-06-19 深圳市浩科电子有限公司 车载控制方法及***
US9842584B1 (en) 2013-03-14 2017-12-12 Amazon Technologies, Inc. Providing content on multiple devices
US10133546B2 (en) * 2013-03-14 2018-11-20 Amazon Technologies, Inc. Providing content on multiple devices
CN103310824A (zh) * 2013-06-27 2013-09-18 长城汽车股份有限公司 车辆智能控制***及具有其的车辆
CN103676826B (zh) * 2013-07-17 2016-09-14 北京时代云英科技有限公司 一种用语音控制车载智能***的方法
CN103428323A (zh) * 2013-07-24 2013-12-04 广东翼卡车联网服务有限公司 一种基于车载主机声控拨打电话的方法及***
CN103516786B (zh) * 2013-08-30 2017-03-15 北京远特科技股份有限公司 车载***通信服务的方法和***
KR102197143B1 (ko) * 2013-11-26 2020-12-31 현대모비스 주식회사 음성 인식을 이용한 명령 수행 시스템 및 그 동작 방법
CN104751843A (zh) * 2013-12-25 2015-07-01 上海博泰悦臻网络技术服务有限公司 一种语音服务切换方法和***
CN105224523A (zh) * 2014-06-08 2016-01-06 上海能感物联网有限公司 非特定人外语语音远程自动导航并驾驶汽车的控制器装置
CN105302081A (zh) * 2014-06-08 2016-02-03 上海能感物联网有限公司 外语自然语文本远程自动导航并驾驶汽车的控制器装置
CN105280185A (zh) * 2014-06-08 2016-01-27 苗码信息科技(上海)股份有限公司 非特定人外语语音远程自动导航并驾驶汽车的方法
CN105469793A (zh) * 2014-09-11 2016-04-06 苗码信息科技(上海)股份有限公司 全自动外语语音现场控制汽车驾驶的方法
CN104332159B (zh) * 2014-10-30 2017-05-10 上海修源网络科技有限公司 一种车载语音操作***人机互动方法及装置
US10116748B2 (en) * 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US9992317B2 (en) * 2015-02-16 2018-06-05 Ford Global Technologies, Llc System and method of facilitating communication between a mobile device and vehicle computer system
CN104883463A (zh) * 2015-04-16 2015-09-02 芜湖宏景电子股份有限公司 车载终端与智能手机语音声控互联互控***
CN104754500A (zh) * 2015-04-16 2015-07-01 芜湖宏景电子股份有限公司 基于蓝牙传输的车载终端与智能手机语音声控互联互控***
CN104767819A (zh) * 2015-04-16 2015-07-08 芜湖宏景电子股份有限公司 基于usb传输的车载终端与智能手机语音声控互联互控***
CN104754499A (zh) * 2015-04-16 2015-07-01 芜湖宏景电子股份有限公司 车载终端与智能手机互联互动虚拟蓝牙***
CN104883464A (zh) * 2015-04-16 2015-09-02 芜湖宏景电子股份有限公司 基于wifi传输的车载终端与智能手机语音声控互联互控***
CN105551494A (zh) * 2015-12-11 2016-05-04 奇瑞汽车股份有限公司 一种基于手机互联的车载语音识别***及识别方法
US9697824B1 (en) * 2015-12-30 2017-07-04 Thunder Power New Energy Vehicle Development Company Limited Voice control system with dialect recognition
JP6701749B2 (ja) * 2016-01-20 2020-05-27 富士電機株式会社 自動販売機及び自動販売機の使用言語出力切替制御方法
CN106059997A (zh) * 2016-05-05 2016-10-26 深圳广联赛讯有限公司 车载语音交互方法及***
CN106649421A (zh) * 2016-05-29 2017-05-10 陈勇 一种人机对话平台
CN106409294B (zh) * 2016-10-18 2019-07-16 广州视源电子科技股份有限公司 防止语音命令误识别的方法和装置
CN106782527B (zh) * 2016-12-16 2020-09-25 福建省汽车工业集团云度新能源汽车股份有限公司 一种智能电动汽车语音控制***及方法
CN106782558A (zh) * 2016-12-27 2017-05-31 重庆峰创科技有限公司 一种带有图像理解的智能语音车载交互***
CN107264447B (zh) * 2017-06-06 2019-12-10 安克创新科技股份有限公司 车辆内语音识别控制方法、***及装置
CN107360175A (zh) * 2017-07-28 2017-11-17 广州亿程交通信息有限公司 车联网控车安全方法
CN107909999A (zh) * 2017-11-14 2018-04-13 深圳市可可卓科科技有限公司 车联网智能应答方法及***
US20190172453A1 (en) * 2017-12-06 2019-06-06 GM Global Technology Operations LLC Seamless advisor engagement
CN108650622B (zh) * 2018-05-09 2021-09-21 爱驰汽车有限公司 行车状态下与广播的交互方法、***、设备及存储介质
CN111145746A (zh) * 2019-12-27 2020-05-12 安徽讯呼信息科技有限公司 一种基于人工智能语音的人机交互方法
CN113472806B (zh) * 2021-07-14 2022-11-22 斑马网络技术有限公司 保护隐私的语音交互方法、装置、***、设备及存储介质
CN116844375B (zh) * 2023-08-29 2023-11-10 荣耀终端有限公司 停车信息的显示方法和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1521481A (zh) * 2003-02-13 2004-08-18 �ղ��Զ�����ʽ���� 信息提供***
CN1598882A (zh) * 2004-09-15 2005-03-23 南京大学 基于phs的etc联网收费方法和***
CN1750499A (zh) * 2004-09-17 2006-03-22 北京优能城际信息技术有限公司 一种语音浏览***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1521481A (zh) * 2003-02-13 2004-08-18 �ղ��Զ�����ʽ���� 信息提供***
CN1598882A (zh) * 2004-09-15 2005-03-23 南京大学 基于phs的etc联网收费方法和***
CN1750499A (zh) * 2004-09-17 2006-03-22 北京优能城际信息技术有限公司 一种语音浏览***

Also Published As

Publication number Publication date
CN102006373A (zh) 2011-04-06

Similar Documents

Publication Publication Date Title
CN102006373B (zh) 基于语音命令控制的车载服务***及方法
CN102202082A (zh) 车载通信***及方法
KR101977072B1 (ko) 음성 파일과 관련된 텍스트의 표시 방법 및 이를 구현한 전자기기
CN103617795A (zh) 一种车载语音识别控制方法及***
CN101937693B (zh) 基于语音命令的视音频播放方法及***
CN104205038A (zh) 信息处理设备,信息处理方法,信息处理程序和终端设备
CN107710322A (zh) 信息提供***、信息提供方法和计算机可读记录介质
CN104010267A (zh) 支持基于翻译的通信服务方法和***和支持该服务的终端
CN108470034A (zh) 一种智能设备服务提供方法及***
CN102196207A (zh) 语音控制电视机的方法、装置和***
CN103137169A (zh) 车载端及通过车载端控制多媒体终端的方法
CN102439661A (zh) 用于车辆内自动交互的面向服务语音识别
CN108062212A (zh) 一种基于场景的语音操作方法及装置
CN103676826A (zh) 一种用语音控制车载智能***的方法
CN201830335U (zh) 基于语音命令的视音频播放***及视音频播放服务器
CN103187079A (zh) 车载信息***
CN106184000A (zh) 一种基于汽车智能后视镜的语音控制方法及***
CN103943108A (zh) 通过方向盘控制器实现手机终端语音导航的方法及***
CN105812474A (zh) 车载终端与智能终端导航***互联装置及其控制方法
CN110544478A (zh) 驾驶舱智能远场语音交互的***及方法
CN101645716B (zh) 一种具有语音识别功能的车载通讯***及其识别方法
CN111918213A (zh) 一种智能车载互联***
CN108650622B (zh) 行车状态下与广播的交互方法、***、设备及存储介质
CN107483993A (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN202043133U (zh) 车载通信***及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHENZHEN VCYBER TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SHENZHEN ZIDONG TECHNOLOGY CO., LTD.

Effective date: 20120320

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518000 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20120320

Address after: Nanshan District Keyuan Road Shenzhen city Guangdong province 518057 No. 6 Science Park East Arts crafts emporium 606A

Applicant after: Shenzhen Vcyber Technology Co., Ltd.

Address before: 914 Tian An Times Building, Shennan Industrial Zone, Che Kung Temple Industrial Zone, Shennan West Road, Shenzhen, Guangdong, Futian District 518000

Applicant before: Shenzhen City Zidong Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Nanshan District Keyuan Road Shenzhen city Guangdong province 518057 No. 6 Science Park East Arts crafts emporium 606A

Patentee after: Car sound intelligent technology Co., Ltd.

Address before: Nanshan District Keyuan Road Shenzhen city Guangdong province 518057 No. 6 Science Park East Arts crafts emporium 606A

Patentee before: Shenzhen Vcyber Technology Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210914

Address after: 610000 No. 777, section 4, Huafu Avenue, Yixin street, Southwest Airport Economic Development Zone, Shuangliu District, Chengdu, Sichuan

Patentee after: Chengdu cheYin Intelligent Technology Co.,Ltd.

Address before: 518057 East 606A Science Park Industrial Building, No. 6 Keyuan Road, Nanshan District, Shenzhen City, Guangdong Province

Patentee before: CHEYIN INTELLIGENT TECHNOLOGY Co.,Ltd.