CN103901450A

CN103901450A - 语音导航方法和***

Info

Publication number: CN103901450A
Application number: CN201210572333.2A
Authority: CN
Inventors: 时红仁
Original assignee: Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Current assignee: Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Priority date: 2012-12-25
Filing date: 2012-12-25
Publication date: 2014-07-02

Abstract

本发明涉及一种语音导航方法和***。方法包括：语音导航终端接收语音导航指令；将语音导航指令以及当前位置的GPS数据信息发送至云端服务器；云端服务器通过语音识别技术对语音导航指令进行识别，得到POI信息；以当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；云端服务器将得到的导航路径及所需时间发送至语音导航终端。***包括语音导航终端和云端服务器，所述语音导航终端包括：语音接收模块、GPS定位模块、信息发送模块和信息接收模块；所述云端服务器包括：语音识别模块、路径规划模块和结果发送模块。本发明使得导航路径规划更为快速。

Description

语音导航方法和***

技术领域

本发明涉及汽车导航技术领域，特别是涉及一种语音导航方法和***。

背景技术

全球定位***（Global Positioning System，GPS）已是社会大众所知内建于个人导航装置的最基本功能，且广泛应用于车内个人导航装置。个人导航装置常见的功能就是提供一地图数据分析以产生适当的导航指令，并将该指令显示于个人导航装置的屏幕上。这类型的个人导航装置通常以吸盘或其它种类的固定元件固定在交通运输工具的前仪表板上。

个人导航装置泛指一种能引导使用者前往预定目的地的装置。这类装置通常内建一组可接受定位数据的***，例如全球定位***接收器，也可能是仅和一有接收定位数据功能的接收器通讯连结。这类装置分析数据的方法有数种，其一为可自行运算所经路线的数据、其二为连线至可提供路径数据运算功能的远端服务器，由该服务器运算并提供导航资料、或者是该装置不但有自行运算功能，同时也能连接到远端服务器接收该服务器的运算数据。手持式全球定位***个人导航装置不需要完全固定在交通运输工具内，而是让使用者能轻易安装或拆卸。这类个人导航装置通常（但非必然）内建有全球定位***天线、导航软件与地图、并可自行绘制、显示地图，几乎可为一完全独立运作的装置。

但是，这些传统的导航设备却很难解决交互的问题。例如，驾驶者为了设置一个目的地不得不找个地方停下来，用手输入和查找目的地位置，这使得目的地导航的便捷性打了折扣。为了解决上述问题，具有语音识别功能的语音导航终端应运而生。语音识别是将人类语音中的词汇内容转换为电子设备的芯片可识别的输入。这样，驾驶者不需要手动输入和查找目的地位置，而只需发出语音指令即可实现导航设备自动向目的地导航的目的。但是，传统的具有语音识别功能的语音导航终端在进行导航时速度较慢，浪费大量时间。

发明内容

本发明所要解决的技术问题是提供一种语音导航方法和***，使得导航路径规划更为快速。

本发明解决其技术问题所采用的技术方案是：提供一种语音导航方法，包括以下步骤：

（1）语音导航终端接收语音导航指令；

（2）将语音导航指令以及当前位置的GPS数据信息发送至云端服务器；

（3）云端服务器通过语音识别技术对语音导航指令进行识别，得到POI信息；

（4）以当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；

（5）云端服务器将得到的导航路径及所需时间发送至语音导航终端。

所述步骤（5）后还包括语音导航终端根据当前时间计算到达POI信息所在位置的时间并显示的步骤。

所述步骤（3）包括以下子步骤：

（31）提取语音导航指令特征；

（32）将语音导航指令特征与语音模型库中的语音模型进行匹配，得到POI信息。

本发明解决其技术问题所采用的技术方案是：提供一种语音导航***，包括语音导航终端和云端服务器，所述语音导航终端包括：语音接收模块，用于接收语音导航指令；GPS定位模块，用于获取车辆当前位置的GPS数据信息；信息发送模块，用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器；结果接收模块，用于接收云端服务器计算得到的导航路径及所需时间；所述云端服务器包括：信息接收模块，用于接收语音导航指令以及当前位置的GPS数据信息；语音识别模块，用于识别接收到的语音导航指令得到POI信息；路径规划模块，用于根据接收到的当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；结果发送模块，用于向导航终端发送得到的导航路径及所需时间。

所述语音导航终端还包括时间计算模块，用于根据当前时间计算到达POI信息所在位置的时间；显示模块，用于显示到达POI信息所在位置的时间。

所述语音识别模块包括：特征提取子模块，用于提取语音导航指令特征；语音模型库，用于存储语音特征；特征匹配子模块，将语音导航指令特征与语音模型库中的语音模型进行匹配，得到POI信息。

有益效果

由于采用了上述的技术方案，本发明与现有技术相比，具有以下的优点和积极效果：本发明不用启动导航软件，将用户的语音指令发送至云端服务器，由云端服务器来进行语音识别以及导航路径规划，并计算经过导航路径所需的时间，将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度，节省了大量时间。本发明还计算到达POI信息所在位置的时间并显示，使得用户能够根据时间确定是否还要去该POI信息所在位置。

附图说明

图1是本发明第一实施方式的流程图；

图2是本发明第一实施方式中语音识别流程图；

图3是本发明第二实施方式的结构方框图；

图4是本发明第二实施方式中语音识别模块结构方框图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的第一实施方式涉及一种语音导航方法，包括以下步骤：语音导航终端接收语音导航指令；将语音导航指令以及当前位置的GPS数据信息发送至云端服务器；云端服务器通过语音识别技术对语音导航指令进行识别，得到POI信息；以当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；云端服务器将得到的导航路径及所需时间发送至语音导航终端。如图1所示，具体步骤如下：

步骤101，语音导航终端接收语音导航指令。也就是说，用户进入车辆内，打开语音导航终端，对着语音导航终端的发出语音导航指令，如金茂大厦。

接着，进入步骤102，将语音导航指令以及当前位置的GPS数据信息发送至云端服务器，即在收到用户发出的语音导航指令后，将收到的语音导航指令存储并将该语音导航指令连同车辆当前位置的GPS数据信息一起发送至云端服务器。

然后，进入步骤103，云端服务器通过语音识别技术对语音导航指令进行识别，得到POI信息。

如图2所示，本步骤中，云端服务器通过语音识别技术对语音导航指令进行识别还包括以下子步骤：

步骤201，提取语音导航指令特征。语音识别的特征有单词（句）、音节和音素三种。单词（句）特征广泛应用于中小词汇语音识别***，但不适合大词汇***，原因在于模型库太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。音节单元多用于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，并且汉语虽然有大约1300个音节，但若不考虑声调，约有408个无调音节，数量相对较少。因此，对于中、大词汇量汉语语音识别***来说，以音节为识别单元基本是可行的。音素单元多用于英语语音识别的研究中，但目前中、大词汇量汉语语音识别***也在越来越多地采用。原因在于汉语音节仅由声母（包括零声母有22个）和韵母（共有28个）构成，且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母，这样虽然增加了模型数目，但提高了易混淆音节的区分能力。

语音识别一个根本的问题是合理的选用特征。特征参数提取的目的是对语音信号进行分析处理，去掉与语音识别无关的冗余信息，获得影响语音识别的重要信息，同时对语音信号进行压缩。语音信号包含了大量各种不同的信息，提取哪些信息，用哪种方式提取，需要综合考虑各方面的因素，如成本，性能，响应时间，计算量等。非特定人语音识别***一般侧重提取反映语义的特征参数，尽量去除说话人的个人信息；而特定人语音识别***则希望在提取反映语义的特征参数的同时，尽量也包含说话人的个人信息。本实施方式可采用线性预测（LP）分析技术进行特征参数提取。

步骤202，将语音导航指令特征与语音模型库中的语音模型进行匹配，得到POI信息。声学模型通常是将获取的语音特征使用训练算法进行训练后产生。在识别时将输入的语音特征同声学模型（模式）进行匹配与比较，得到最佳的识别结果。声学模型是识别***的底层模型，并且是语音识别***中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小（字发音模型、半音节模型或音素模型）对语音训练数据量大小、***识别率，以及灵活性有较大的影响。必须根据不同语言的特点、识别***词汇量的大小决定识别单元的大小。以汉语为例：汉语按音素的发音特征分类分为辅音、单元音、复元音、复鼻尾音四种，按音节结构分类为声母和韵母。并且由音素构成声母或韵母。有时，将含有声调的韵母称为调母。由单个调母或由声母与调母拼音成为音节。汉语的一个音节就是汉语一个字的音，即音节字。由音节字构成词，最后再由词构成句子。汉语声母共有22个，其中包括零声母，韵母共有38个。按音素分类，汉语辅音共有22个，单元音13个，复元音13个，复鼻尾音16个。目前常用的声学模型基元为声韵母、音节或词，根据实现目的不同来选取不同的基元。汉语加上语气词共有412个音节，包括轻音字，共有1282个有调音节字，所以当在小词汇表孤立词语音识别时常选用词作为基元，在大词汇表语音识别时常采用音节或声韵母建模，而在连续语音识别时，由于协同发音的影响，常采用声韵母建模。

之后，进入步骤104，以当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间。例如，用户当前位置的GPS数据信息显示其起点为西郊庄园，以“西郊庄园”为起点，以“金茂大厦”为终点，得到一条“起点—北翟高架路—外环高速公路—延安高架路—终点”的导航路径，并计算得到经过该导航路径所用时间为约为48分钟。

最后，进入步骤105，云端服务器将得到的导航路径及所需时间发送至语音导航终端。仍然以上述例子为例，云端服务器将得到的“起点—北翟高架路—外环高速公路—延安高架路—终点”导航路径，以及约48分钟行驶完上述导航路径的信息发送至语音导航终端。语音导航终端收到上述信息后可以显示在导航终端的显示屏上。

不难发现，本发明不用启动导航软件，将用户的语音指令发送至云端服务器，由云端服务器来进行语音识别以及导航路径规划，并计算经过导航路径所需的时间，将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度，节省了大量时间。

值得一提的是，本实施方式中语音导航终端在收到导航路径及所需时间后还包括步骤106，根据当前时间计算到达目的地的时间，并且显示该时间，例如当前时间为11:06分，根据得到的时间为48分钟，加上48分钟，可知到达目的地的时间为11:54分，并通过显示该时间。由此可见，本发明还计算到达POI信息所在位置的时间并显示，使得用户能够根据时间确定是否还要去该POI信息所在位置。

本发明的第二实施方式涉及一种语音导航***，如图3所示，包括语音导航终端和云端服务器。所述语音导航终端包括：语音接收模块301，用于接收语音导航指令；GPS定位模块302，用于获取车辆当前位置的GPS数据信息；信息发送模块303，用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器；结果接收模块304用于接收云端服务器计算得到的导航路径及所需时间；本领域技术人员理解，所述语音导航终端可以是车载语音导航终端，也可以是如手机之类的个人移动通信终端。本发明可以采用各种不同制式的移动通信模块来实现语音导航终端与云端服务器之间的数据传输，这是现有技术，在此不予赘述。所述云端服务器包括：信息接收模块310、语音识别模块305、路径规划模块306和结果发送模块307。所述信息接收模块310用于接收所述收到的语音导航指令和所述当前位置的GPS数据信息；所述语音识别模块305，用于接收到的识别语音导航指令得到POI信息；所述路径规划模块306，用于根据接收到的当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；所述结果发送模块307，用于向导航终端发送得到的导航路径及所需时间。所述语音导航终端还包括时间计算模块308，用于根据当前时间计算到达POI信息所在位置的时间；显示模块309，用于显示到达POI信息所在位置的时间。

如图4所示，所述语音识别模块包括：特征提取子模块401，用于提取语音导航指令特征；语音模型库403，用于存储语音特征；特征匹配子模块402，将语音导航指令特征与语音模型库中的语音模型进行匹配，得到POI信息。

不难发现，本发明不用启动导航软件，将用户的语音指令发送至云端服务器，由云端服务器来进行语音识别以及导航路径规划，并计算经过导航路径所需的时间，将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度，节省了大量时间。本发明还计算到达POI信息所在位置的时间并显示，使得用户能够根据时间确定是否还要去该POI信息所在位置。

Claims

1.一种语音导航方法，其特征在于，包括以下步骤：

（1）语音导航终端接收语音导航指令；

2.根据权利要求1所述的语音导航方法，其特征在于，所述步骤（5）后还包括语音导航终端根据当前时间计算到达POI信息所在位置的时间并显示的步骤。

3.根据权利要求1所述的语音导航方法，其特征在于，所述步骤（3）包括以下子步骤：

（31）提取语音导航指令特征；

4.一种语音导航***，包括语音导航终端和云端服务器，其特征在于，所述语音导航终端包括：语音接收模块，用于接收语音导航指令；GPS定位模块，用于获取车辆当前位置的GPS数据信息；信息发送模块，用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器；结果接收模块，用于接收云端服务器计算得到的导航路径及所需时间；所述云端服务器包括：信息接收模块，用于接收语音导航指令以及当前位置的GPS数据信息；语音识别模块，用于识别接收到的语音导航指令得到POI信息；路径规划模块，用于根据接收到的当前位置的GPS数据信息为起点，POI信息所在位置为终点建立导航路径，并计算该导航路径所需时间；结果发送模块，用于向导航终端发送得到的导航路径及所需时间。

5.根据权利要求4所述的语音导航***，其特征在于，所述语音导航终端还包括时间计算模块，用于根据当前时间计算到达POI信息所在位置的时间；显示模块，用于显示到达POI信息所在位置的时间。

6.根据权利要求4所述的语音导航***，其特征在于，所述语音识别模块包括：特征提取子模块，用于提取语音导航指令特征；语音模型库，用于存储语音特征；特征匹配子模块，将语音导航指令特征与语音模型库中的语音模型进行匹配，得到POI信息。