CN103901450A - 语音导航方法和*** - Google Patents

语音导航方法和*** Download PDF

Info

Publication number
CN103901450A
CN103901450A CN201210572333.2A CN201210572333A CN103901450A CN 103901450 A CN103901450 A CN 103901450A CN 201210572333 A CN201210572333 A CN 201210572333A CN 103901450 A CN103901450 A CN 103901450A
Authority
CN
China
Prior art keywords
voice navigation
voice
cloud server
module
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210572333.2A
Other languages
English (en)
Inventor
时红仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Original Assignee
Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pateo Electronic Equipment Manufacturing Co Ltd filed Critical Shanghai Pateo Electronic Equipment Manufacturing Co Ltd
Priority to CN201210572333.2A priority Critical patent/CN103901450A/zh
Publication of CN103901450A publication Critical patent/CN103901450A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Navigation (AREA)

Abstract

本发明涉及一种语音导航方法和***。方法包括:语音导航终端接收语音导航指令;将语音导航指令以及当前位置的GPS数据信息发送至云端服务器;云端服务器通过语音识别技术对语音导航指令进行识别,得到POI信息;以当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;云端服务器将得到的导航路径及所需时间发送至语音导航终端。***包括语音导航终端和云端服务器,所述语音导航终端包括:语音接收模块、GPS定位模块、信息发送模块和信息接收模块;所述云端服务器包括:语音识别模块、路径规划模块和结果发送模块。本发明使得导航路径规划更为快速。

Description

语音导航方法和***
技术领域
本发明涉及汽车导航技术领域,特别是涉及一种语音导航方法和***。
背景技术
全球定位***(Global Positioning System,GPS)已是社会大众所知内建于个人导航装置的最基本功能,且广泛应用于车内个人导航装置。个人导航装置常见的功能就是提供一地图数据分析以产生适当的导航指令,并将该指令显示于个人导航装置的屏幕上。这类型的个人导航装置通常以吸盘或其它种类的固定元件固定在交通运输工具的前仪表板上。
个人导航装置泛指一种能引导使用者前往预定目的地的装置。这类装置通常内建一组可接受定位数据的***,例如全球定位***接收器,也可能是仅和一有接收定位数据功能的接收器通讯连结。这类装置分析数据的方法有数种,其一为可自行运算所经路线的数据、其二为连线至可提供路径数据运算功能的远端服务器,由该服务器运算并提供导航资料、或者是该装置不但有自行运算功能,同时也能连接到远端服务器接收该服务器的运算数据。手持式全球定位***个人导航装置不需要完全固定在交通运输工具内,而是让使用者能轻易安装或拆卸。这类个人导航装置通常(但非必然)内建有全球定位***天线、导航软件与地图、并可自行绘制、显示地图,几乎可为一完全独立运作的装置。
但是,这些传统的导航设备却很难解决交互的问题。例如,驾驶者为了设置一个目的地不得不找个地方停下来,用手输入和查找目的地位置,这使得目的地导航的便捷性打了折扣。为了解决上述问题,具有语音识别功能的语音导航终端应运而生。语音识别是将人类语音中的词汇内容转换为电子设备的芯片可识别的输入。这样,驾驶者不需要手动输入和查找目的地位置,而只需发出语音指令即可实现导航设备自动向目的地导航的目的。但是,传统的具有语音识别功能的语音导航终端在进行导航时速度较慢,浪费大量时间。
发明内容
本发明所要解决的技术问题是提供一种语音导航方法和***,使得导航路径规划更为快速。
本发明解决其技术问题所采用的技术方案是:提供一种语音导航方法,包括以下步骤:
(1)语音导航终端接收语音导航指令;
(2)将语音导航指令以及当前位置的GPS数据信息发送至云端服务器;
(3)云端服务器通过语音识别技术对语音导航指令进行识别,得到POI信息;
(4)以当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;
(5)云端服务器将得到的导航路径及所需时间发送至语音导航终端。
所述步骤(5)后还包括语音导航终端根据当前时间计算到达POI信息所在位置的时间并显示的步骤。
所述步骤(3)包括以下子步骤:
(31)提取语音导航指令特征;
(32)将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。
本发明解决其技术问题所采用的技术方案是:提供一种语音导航***,包括语音导航终端和云端服务器,所述语音导航终端包括:语音接收模块,用于接收语音导航指令;GPS定位模块,用于获取车辆当前位置的GPS数据信息;信息发送模块,用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器;结果接收模块,用于接收云端服务器计算得到的导航路径及所需时间;所述云端服务器包括:信息接收模块,用于接收语音导航指令以及当前位置的GPS数据信息;语音识别模块,用于识别接收到的语音导航指令得到POI信息;路径规划模块,用于根据接收到的当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;结果发送模块,用于向导航终端发送得到的导航路径及所需时间。
所述语音导航终端还包括时间计算模块,用于根据当前时间计算到达POI信息所在位置的时间;显示模块,用于显示到达POI信息所在位置的时间。
所述语音识别模块包括:特征提取子模块,用于提取语音导航指令特征;语音模型库,用于存储语音特征;特征匹配子模块,将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明不用启动导航软件,将用户的语音指令发送至云端服务器,由云端服务器来进行语音识别以及导航路径规划,并计算经过导航路径所需的时间,将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度,节省了大量时间。本发明还计算到达POI信息所在位置的时间并显示,使得用户能够根据时间确定是否还要去该POI信息所在位置。
附图说明
图1是本发明第一实施方式的流程图;
图2是本发明第一实施方式中语音识别流程图;
图3是本发明第二实施方式的结构方框图;
图4是本发明第二实施方式中语音识别模块结构方框图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的第一实施方式涉及一种语音导航方法,包括以下步骤:语音导航终端接收语音导航指令;将语音导航指令以及当前位置的GPS数据信息发送至云端服务器;云端服务器通过语音识别技术对语音导航指令进行识别,得到POI信息;以当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;云端服务器将得到的导航路径及所需时间发送至语音导航终端。如图1所示,具体步骤如下:
步骤101,语音导航终端接收语音导航指令。也就是说,用户进入车辆内,打开语音导航终端,对着语音导航终端的发出语音导航指令,如金茂大厦。
接着,进入步骤102,将语音导航指令以及当前位置的GPS数据信息发送至云端服务器,即在收到用户发出的语音导航指令后,将收到的语音导航指令存储并将该语音导航指令连同车辆当前位置的GPS数据信息一起发送至云端服务器。
然后,进入步骤103,云端服务器通过语音识别技术对语音导航指令进行识别,得到POI信息。
如图2所示,本步骤中,云端服务器通过语音识别技术对语音导航指令进行识别还包括以下子步骤:
步骤201,提取语音导航指令特征。语音识别的特征有单词(句)、音节和音素三种。单词(句)特征广泛应用于中小词汇语音识别***,但不适合大词汇***,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。音节单元多用于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别***来说,以音节为识别单元基本是可行的。音素单元多用于英语语音识别的研究中,但目前中、大词汇量汉语语音识别***也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。
语音识别一个根本的问题是合理的选用特征。特征参数提取的目的是对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩。语音信号包含了大量各种不同的信息,提取哪些信息,用哪种方式提取,需要综合考虑各方面的因素,如成本,性能,响应时间,计算量等。非特定人语音识别***一般侧重提取反映语义的特征参数,尽量去除说话人的个人信息;而特定人语音识别***则希望在提取反映语义的特征参数的同时,尽量也包含说话人的个人信息。本实施方式可采用线性预测(LP)分析技术进行特征参数提取。
步骤202,将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。声学模型通常是将获取的语音特征使用训练算法进行训练后产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。声学模型是识别***的底层模型,并且是语音识别***中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、***识别率,以及灵活性有较大的影响。必须根据不同语言的特点、识别***词汇量的大小决定识别单元的大小。以汉语为例:汉语按音素的发音特征分类分为辅音、单元音、复元音、复鼻尾音四种,按音节结构分类为声母和韵母。并且由音素构成声母或韵母。有时,将含有声调的韵母称为调母。由单个调母或由声母与调母拼音成为音节。汉语的一个音节就是汉语一个字的音,即音节字。由音节字构成词,最后再由词构成句子。汉语声母共有22个,其中包括零声母,韵母共有38个。按音素分类,汉语辅音共有22个,单元音13个,复元音13个,复鼻尾音16个。目前常用的声学模型基元为声韵母、音节或词,根据实现目的不同来选取不同的基元。汉语加上语气词共有412个音节,包括轻音字,共有1282个有调音节字,所以当在小词汇表孤立词语音识别时常选用词作为基元,在大词汇表语音识别时常采用音节或声韵母建模,而在连续语音识别时,由于协同发音的影响,常采用声韵母建模。
之后,进入步骤104,以当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间。例如,用户当前位置的GPS数据信息显示其起点为西郊庄园,以“西郊庄园”为起点,以“金茂大厦”为终点,得到一条“起点—北翟高架路—外环高速公路—延安高架路—终点”的导航路径,并计算得到经过该导航路径所用时间为约为48分钟。
最后,进入步骤105,云端服务器将得到的导航路径及所需时间发送至语音导航终端。仍然以上述例子为例,云端服务器将得到的“起点—北翟高架路—外环高速公路—延安高架路—终点”导航路径,以及约48分钟行驶完上述导航路径的信息发送至语音导航终端。语音导航终端收到上述信息后可以显示在导航终端的显示屏上。
不难发现,本发明不用启动导航软件,将用户的语音指令发送至云端服务器,由云端服务器来进行语音识别以及导航路径规划,并计算经过导航路径所需的时间,将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度,节省了大量时间。
值得一提的是,本实施方式中语音导航终端在收到导航路径及所需时间后还包括步骤106,根据当前时间计算到达目的地的时间,并且显示该时间,例如当前时间为11:06分,根据得到的时间为48分钟,加上48分钟,可知到达目的地的时间为11:54分,并通过显示该时间。由此可见,本发明还计算到达POI信息所在位置的时间并显示,使得用户能够根据时间确定是否还要去该POI信息所在位置。
本发明的第二实施方式涉及一种语音导航***,如图3所示,包括语音导航终端和云端服务器。所述语音导航终端包括:语音接收模块301,用于接收语音导航指令;GPS定位模块302,用于获取车辆当前位置的GPS数据信息;信息发送模块303,用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器;结果接收模块304用于接收云端服务器计算得到的导航路径及所需时间;本领域技术人员理解,所述语音导航终端可以是车载语音导航终端,也可以是如手机之类的个人移动通信终端。本发明可以采用各种不同制式的移动通信模块来实现语音导航终端与云端服务器之间的数据传输,这是现有技术,在此不予赘述。所述云端服务器包括:信息接收模块310、语音识别模块305、路径规划模块306和结果发送模块307。所述信息接收模块310用于接收所述收到的语音导航指令和所述当前位置的GPS数据信息;所述语音识别模块305,用于接收到的识别语音导航指令得到POI信息;所述路径规划模块306,用于根据接收到的当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;所述结果发送模块307,用于向导航终端发送得到的导航路径及所需时间。所述语音导航终端还包括时间计算模块308,用于根据当前时间计算到达POI信息所在位置的时间;显示模块309,用于显示到达POI信息所在位置的时间。
如图4所示,所述语音识别模块包括:特征提取子模块401,用于提取语音导航指令特征;语音模型库403,用于存储语音特征;特征匹配子模块402,将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。
不难发现,本发明不用启动导航软件,将用户的语音指令发送至云端服务器,由云端服务器来进行语音识别以及导航路径规划,并计算经过导航路径所需的时间,将最终时间返还给用户。通过云端来进行语音识别和导航路径规划保证了运行速度,节省了大量时间。本发明还计算到达POI信息所在位置的时间并显示,使得用户能够根据时间确定是否还要去该POI信息所在位置。

Claims (6)

1.一种语音导航方法,其特征在于,包括以下步骤:
(1)语音导航终端接收语音导航指令;
(2)将语音导航指令以及当前位置的GPS数据信息发送至云端服务器;
(3)云端服务器通过语音识别技术对语音导航指令进行识别,得到POI信息;
(4)以当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;
(5)云端服务器将得到的导航路径及所需时间发送至语音导航终端。
2.根据权利要求1所述的语音导航方法,其特征在于,所述步骤(5)后还包括语音导航终端根据当前时间计算到达POI信息所在位置的时间并显示的步骤。
3.根据权利要求1所述的语音导航方法,其特征在于,所述步骤(3)包括以下子步骤:
(31)提取语音导航指令特征;
(32)将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。
4.一种语音导航***,包括语音导航终端和云端服务器,其特征在于,所述语音导航终端包括:语音接收模块,用于接收语音导航指令;GPS定位模块,用于获取车辆当前位置的GPS数据信息;信息发送模块,用于将收到的语音导航指令以及当前位置的GPS数据信息发送至云端服务器;结果接收模块,用于接收云端服务器计算得到的导航路径及所需时间;所述云端服务器包括:信息接收模块,用于接收语音导航指令以及当前位置的GPS数据信息;语音识别模块,用于识别接收到的语音导航指令得到POI信息;路径规划模块,用于根据接收到的当前位置的GPS数据信息为起点,POI信息所在位置为终点建立导航路径,并计算该导航路径所需时间;结果发送模块,用于向导航终端发送得到的导航路径及所需时间。
5.根据权利要求4所述的语音导航***,其特征在于,所述语音导航终端还包括时间计算模块,用于根据当前时间计算到达POI信息所在位置的时间;显示模块,用于显示到达POI信息所在位置的时间。
6.根据权利要求4所述的语音导航***,其特征在于,所述语音识别模块包括:特征提取子模块,用于提取语音导航指令特征;语音模型库,用于存储语音特征;特征匹配子模块,将语音导航指令特征与语音模型库中的语音模型进行匹配,得到POI信息。
CN201210572333.2A 2012-12-25 2012-12-25 语音导航方法和*** Pending CN103901450A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210572333.2A CN103901450A (zh) 2012-12-25 2012-12-25 语音导航方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210572333.2A CN103901450A (zh) 2012-12-25 2012-12-25 语音导航方法和***

Publications (1)

Publication Number Publication Date
CN103901450A true CN103901450A (zh) 2014-07-02

Family

ID=50992898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210572333.2A Pending CN103901450A (zh) 2012-12-25 2012-12-25 语音导航方法和***

Country Status (1)

Country Link
CN (1) CN103901450A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684587A (zh) * 2014-12-10 2016-06-22 井关农机株式会社 农用作业车辆
CN107393557A (zh) * 2017-07-11 2017-11-24 深圳市古古美美实业有限公司 车载语音交互装置及***
CN111078934A (zh) * 2019-12-23 2020-04-28 上海擎感智能科技有限公司 基于地图的语音记录和播放方法、***、介质及装置
CN112212880A (zh) * 2020-09-27 2021-01-12 上汽通用五菱汽车股份有限公司 语音导航方法、无屏车载设备、***及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105684587A (zh) * 2014-12-10 2016-06-22 井关农机株式会社 农用作业车辆
CN107393557A (zh) * 2017-07-11 2017-11-24 深圳市古古美美实业有限公司 车载语音交互装置及***
CN111078934A (zh) * 2019-12-23 2020-04-28 上海擎感智能科技有限公司 基于地图的语音记录和播放方法、***、介质及装置
CN112212880A (zh) * 2020-09-27 2021-01-12 上汽通用五菱汽车股份有限公司 语音导航方法、无屏车载设备、***及可读存储介质

Similar Documents

Publication Publication Date Title
CN109036391B (zh) 语音识别方法、装置及***
KR102414456B1 (ko) 대화 시스템, 이를 포함하는 차량 및 유고 정보 처리 방법
JP6017678B2 (ja) 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡
CN109243428B (zh) 一种建立语音识别模型的方法、语音识别方法及***
US20060100871A1 (en) Speech recognition method, apparatus and navigation system
EP3005348B1 (en) Speech-based search using descriptive features of surrounding objects
US20100094626A1 (en) Method and apparatus for locating speech keyword and speech recognition system
US9541415B2 (en) Navigation system with touchless command mechanism and method of operation thereof
US9431010B2 (en) Speech-recognition device and speech-recognition method
CN101162153A (zh) 一种语音控制的车载gps导航***及其实现方法
US10515634B2 (en) Method and apparatus for searching for geographic information using interactive voice recognition
US20040215454A1 (en) Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded
CN102693723A (zh) 一种基于子空间的非特定人孤立词识别方法及装置
CN103901450A (zh) 语音导航方法和***
JP5335165B2 (ja) 発音情報生成装置、車載情報装置およびデータベース生成方法
KR101063607B1 (ko) 음성인식을 이용한 명칭 검색 기능을 가지는 네비게이션시스템 및 그 방법
JP2008234427A (ja) ユーザ間の対話を支援する装置、方法およびプログラム
US20220375469A1 (en) Intelligent voice recognition method and apparatus
JP5009037B2 (ja) 音声認識装置、その音声認識方法
CN114842835A (zh) 一种基于深度学习模型的语音交互***
EP1024476A1 (en) Speech recognizing device and method, navigation device, portable telephone, and information processor
JP3645104B2 (ja) 辞書検索装置及び辞書検索プログラムを記録した記録媒体
Qian et al. Phone modeling and combining discriminative training for mandarinenglish bilingual speech recognition
JP2011232668A (ja) 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法
JP2020160285A (ja) エージェント装置、情報提供方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140702