CN106205613A - 一种导航语音识别方法及*** - Google Patents

一种导航语音识别方法及*** Download PDF

Info

Publication number
CN106205613A
CN106205613A CN201610587485.8A CN201610587485A CN106205613A CN 106205613 A CN106205613 A CN 106205613A CN 201610587485 A CN201610587485 A CN 201610587485A CN 106205613 A CN106205613 A CN 106205613A
Authority
CN
China
Prior art keywords
similarity
result
recognition
client
data base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610587485.8A
Other languages
English (en)
Other versions
CN106205613B (zh
Inventor
梁国锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Maitu Information Technology Co ltd
Original Assignee
SHENZHEN WISDOM TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN WISDOM TECHNOLOGY Co Ltd filed Critical SHENZHEN WISDOM TECHNOLOGY Co Ltd
Priority to CN201610587485.8A priority Critical patent/CN106205613B/zh
Publication of CN106205613A publication Critical patent/CN106205613A/zh
Application granted granted Critical
Publication of CN106205613B publication Critical patent/CN106205613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种导航语音识别方法及***,所述导航语音识别方法包括以下步骤:将客户端收到的语音信息通过语音引擎进行语音识别;对语音识别的结果根据识别地域检索后台数据库,如果存在对应数据记录,则将识别结果返回到客户端;如不存在对应数据记录,则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据,如果存在相似度大于预设值的结果,则将相似度大于预设值的结果按照使用频率降序推荐给用户;如果在本地没有相似度大于预设值的结果,则将其返回至后台服务器数据库中,根据相似度降序排序所有记录,返回至客户端。本发明的技术方案能根据识别结果推荐更接近用户输入的结果,减少搜寻时间。

Description

一种导航语音识别方法及***
技术领域
本发明属于语音识别技术领域,尤其涉及一种导航语音识别方法及***。
背景技术
语音识别技术是近十年来信息技术领域十大重要的科技发展技术之一,主要应用于语音拨号、语音导航、室内设备控制、语音搜索、听写数据录入等。语音识别技术一般包括声学模型和语言模型,声学模型负责完成语音到音素的转换,其中所述语音如英语中的音标和中文中的拼音的声韵母;语言模型负责完成音素到文本的转换,两者配合完成语音到文本的识别过程。
现有技术中一般有三种语音识别技术:第一种是基于云端识别引擎的语音识别技术,第二种是基于本地语音识别引擎的语音识别技术,第三种是同时基于本地语音识别引擎和云端识别引擎的语音识别技术。而不管采用上述任意一种语言识别技术,由于语音识别过程是智能的,会出现同音不同字的情况,因此就会出现多个识别结果。当存在多个识别结果时,对识别结果进行排序显得尤为重要。现有技术中一般是将识别结果按照相似度由高到低排序的识别结果返回给用户。另外,现有的语音识别引擎识别率低,正常环境下大部分识别结果与期望结果相差较大。再者,同时按照相似度由高到低排序的识别结果返回给用户,会使得发音不标准的用户每次都需要花大量的时间去寻找所需识别结果。
发明内容
针对以上技术问题,本发明公开了一种导航语音识别方法及***,通过特定识别地域及语音引擎识别结果分析,并获取更接近输入语音的结果。
对此,本发明采用的技术方案为:
一种导航语音识别方法,其包括以下步骤:
步骤S1:将客户端收到的语音信息通过语音引擎进行语音识别;
步骤S2:对步骤S1语音识别的结果根据识别地域检索后台数据库,如果存在对应数据记录,则将识别结果返回到客户端,识别完成;
如果不存在对应数据记录,则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据,如果存在相似度大于预设值的的结果,则将该相似度大于预设值的数据按照使用频率降序排序推荐给用户;如果在本地数据库中没有相似度大于预设值的数据,则将该识别结果返回至后台服务器数据库中,后台服务器计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录,并将排序结果返回至客户端;其中,所述相近似的数据是指大于预设相似度的数据;
如后台服务器数据库中也没有大于预设相似度的数据,则本次语音识别错误,并反馈给客户端。
其中,本地数据库是指设备自带的存储数据库。
采用此技术方案,通过多种途径实现对语音识别的辨认,并结合特定识别地域获取更接近输入语音的结果,减少搜寻时间。
作为本发明的进一步改进,步骤S2中,首选对步骤S1语音识别的结果进行判断,是否为有效结果,然后进行检索。采用此技术方案,首先对识别结果进行初步分析,看是否为有效结果,如果不是,则不再进行下一步的检索,使结果反馈更快,节约不必要的时间浪费。
作为本发明的进一步改进,步骤S2中,如果存在相似度大于预设值的结果,则将其按照使用频率降序排序推荐给用户,并获取用户当前位置信息,根据地域范围筛选数据,反馈至客户端。采用此技术方案,结合用户当前位置信息进行分析,使得识别分析的结果更加准确。
作为本发明的进一步改进,步骤S2中,如果在本地数据库中没有相近似的结果,则将该识别结果返回至后台服务器数据库中,服务器计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录,并将排序结果返回至客户端,并获取用户当前位置信息,根据地域范围筛选数据,反馈至客户端。
作为本发明的进一步改进,步骤S2中,如后台服务器数据库中也没有大于预设相似度的数据,则本次语音识别错误,并反馈给客户端,同时告知用户重新输入语音信息或者加入限定词或者扩展词。
作为本发明的进一步改进,步骤S2中,所述预设相似度不小于50%。
本发明还公开了一种语音识别***,所述语音识别***包括语音接收模块、语音识别模块、本地数据库、通讯模块、后台服务器和发送模块;其中,所述语音接收模块,用于接收客户端发送的语音信息;所述语音识别模块,用于将语音信息根据识别地域检索后台服务器数据库查找对应数据记录,或从本地数据库中寻找预设地域范围内的、与识别结果相近似的数据;所述通讯模块,用于与后台服务器连接,则将该识别结果返回至后台服务器数据库中;所述后台服务器,用于计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录;发送模块,用于将排序结果返回至客户端。
与现有技术相比,本发明的有益效果为:
采用本发明的技术方案,通过特定识别地域及语音引擎识别结果分析,并获取更接近输入语音的结果,减少搜寻时间,使用更加方便。本发明的技术方案可以应用在各个需要语音识别的平台上,尤其是智能终端。
附图说明
图1是本发明一种实施例的流程图。
具体实施方式
下面结合附图,对本发明的较优的实施例作进一步的详细说明。
一种导航语音识别方法,如图1所示,首先使用第三方语音引擎获得识别结果后,根据用户所选的语音内容识别地域通过后在台服务器数据库中检索看是否存在对应的记录,即完全相同的记录;若存在,则将语音引擎得出的识别结果发送至客户端;此种结果仅仅一个识别结果对应后台服务器检索数据库中一个数据;若识别的结果与数据库中对比无完全相同的,则认为识别结果存在一定的谬误,并发送语音识别结果的同时,告之客户端识别结果存在谬误同时进入下一步;然后在本地数据库中寻找预设地域范围内的与识别结果相近似的数据,然后以使用频率降序排列推荐给用户,减少用户搜寻时间;其中,所述相近似的数据是指大于预设相似度的数据。另外,如果在本地数据库中寻找不到大于预设相似度的数据,则将该识别结果返回至后台服务器检索数据中,后台服务器计算出数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录,并将排序结果返回至客户端。如后台服务器数据库同样也寻找不到大于预设相似度的数据,则认为本次语音识别错误,并反馈给客户端,提醒用户重新输入语音信息或者加入限定词或者扩展词。
例如,用户在成都需要导航至广州市广州塔,在成都输入语音“广州塔”而预设的地域范围为市辖区即只搜索成都市的地名,则在后台无法搜索到与“广州塔”相对应的数据;下一步则在本地数据库中搜索,如本地数据库中存在 “光轴塔”“光州塔”以及“逛周它”“广州塔”,其频率分别为A、B、C以及D,D>C>B>A,那么呈现给用户的信息是由上往下依次为“广州塔”,“逛周它”,“光州塔”,“光轴塔”,即方便客户选取,识别成功。
如本地数据库预设的相似度为大于50%,而其识别结果“广州塔”无法找到与之相似度大于50%的数据,那么将识别结果“广州塔”反馈至后台服务器数据库中检索,通过后台服务器计算出数据库中所有记录与识别结果的相似度,将相似度超过预设阈值的数据根据相似度降序排序所有记录,并将排序结果返回至客户端。
如通过服务端计算出数据库中所有记录与识别结果的相似度,其相似度均小于预设阈值,则识别失败,那么反馈给用户该次语音输入错误,并且提示用户更换语音或者加入限定词或者扩展词,如在成都的用户需要导航位于广州的“广州塔”,则输入语音信息的时候加上扩展词,即输入语音为“广州市广州塔”。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.一种导航语音识别方法,其特征在于:其包括以下步骤:
步骤S1:将客户端收到的语音信息通过语音引擎进行语音识别;
步骤S2:对步骤S1语音识别的结果根据识别地域检索后台服务器数据库,如果存在对应数据记录,则将识别结果返回到客户端,识别完成;
如果不存在对应数据记录,则从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据,如果存在相似度大于预设值的数据,则将该相似度大于预设值的数据按照使用频率降序排序推荐给用户;如果在本地数据库中没有相似度大于预设值的数据,则将该识别结果返回至后台服务器数据库中,后台服务器计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录,并将排序结果返回至客户端;
如后台服务器数据库中也没有大于预设相似度的数据,则本次语音识别错误,并反馈给客户端。
2.根据权利要求1所述的导航语音识别方法,其特征在于:步骤S2中,首选对步骤S1语音识别的结果进行判断,是否为有效结果,然后进行检索。
3.根据权利要求1所述的导航语音识别方法,其特征在于:步骤S2中,如果存在相似度大于预设值的结果,则将其按照使用频率降序排序推荐给用户,并获取用户当前位置信息,根据地域范围筛选数据,反馈至客户端。
4.根据权利要求1所述的导航语音识别方法,其特征在于:步骤S2中,如果在本地数据库中没有相近似的结果,则将该识别结果返回至后台服务器数据库中,服务器计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录,并将排序结果返回至客户端,并获取用户当前位置信息,根据地域范围筛选数据,反馈至客户端。
5.根据权利要求1~4任意一项所述的导航语音识别方法,其特征在于:步骤S2中,如后台服务器数据库中也没有大于预设相似度的数据,则本次语音识别错误,并反馈给客户端,同时告知用户重新输入语音信息或者加入限定词或者扩展词。
6.根据权利要求5所述的导航语音识别方法,其特征在于:步骤S2中,所述预设相似度不小于50%。
7.一种语音识别***,其特征在于:所述语音识别***包括语音接收模块、语音识别模块、本地数据库、通讯模块、后台服务器和发送模块;
其中,所述语音接收模块,用于接收客户端发送的语音信息;
所述语音识别模块,用于将语音信息根据识别地域检索后台服务器数据库查找对应数据记录,或从本地数据库中寻找预设地域范围内的、与识别结果相似度大于预设值的数据;所述通讯模块,用于与后台服务器连接,则将该识别结果返回至后台服务器数据库中;
所述后台服务器,用于计算出后台服务器数据库中所有记录与识别结果的相似度,根据相似度降序排序所有记录;
发送模块,用于将排序结果返回至客户端。
CN201610587485.8A 2016-07-22 2016-07-22 一种导航语音识别方法及*** Active CN106205613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610587485.8A CN106205613B (zh) 2016-07-22 2016-07-22 一种导航语音识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610587485.8A CN106205613B (zh) 2016-07-22 2016-07-22 一种导航语音识别方法及***

Publications (2)

Publication Number Publication Date
CN106205613A true CN106205613A (zh) 2016-12-07
CN106205613B CN106205613B (zh) 2019-09-06

Family

ID=57491795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610587485.8A Active CN106205613B (zh) 2016-07-22 2016-07-22 一种导航语音识别方法及***

Country Status (1)

Country Link
CN (1) CN106205613B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993654A (zh) * 2017-11-24 2018-05-04 珠海格力电器股份有限公司 一种语音指令识别方法及***
CN108804070A (zh) * 2018-05-30 2018-11-13 Oppo广东移动通信有限公司 音乐播放方法、装置、存储介质及电子设备
CN109101475A (zh) * 2017-06-20 2018-12-28 北京嘀嘀无限科技发展有限公司 出行语音识别方法、***和计算机设备
CN111276147A (zh) * 2019-12-30 2020-06-12 天津大学 一种基于语音输入的饮食记录方法
CN114333828A (zh) * 2022-03-08 2022-04-12 深圳市华方信息产业有限公司 用于数码产品的快速语音识别***
US11302313B2 (en) 2017-06-15 2022-04-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for speech recognition

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123290A (ja) * 2000-10-16 2002-04-26 Pioneer Electronic Corp 音声認識装置ならびに音声認識方法
CN101290768A (zh) * 2008-06-20 2008-10-22 清华大学 基于嵌入式环境下的中文大词汇量语音查询方法
CN102968987A (zh) * 2012-11-19 2013-03-13 百度在线网络技术(北京)有限公司 一种语音识别方法及***
WO2015133142A1 (ja) * 2014-03-06 2015-09-11 株式会社デンソー 報知装置
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105632499A (zh) * 2014-10-31 2016-06-01 株式会社东芝 用于优化语音识别结果的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123290A (ja) * 2000-10-16 2002-04-26 Pioneer Electronic Corp 音声認識装置ならびに音声認識方法
CN101290768A (zh) * 2008-06-20 2008-10-22 清华大学 基于嵌入式环境下的中文大词汇量语音查询方法
CN102968987A (zh) * 2012-11-19 2013-03-13 百度在线网络技术(北京)有限公司 一种语音识别方法及***
WO2015133142A1 (ja) * 2014-03-06 2015-09-11 株式会社デンソー 報知装置
CN105632499A (zh) * 2014-10-31 2016-06-01 株式会社东芝 用于优化语音识别结果的方法和装置
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11302313B2 (en) 2017-06-15 2022-04-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for speech recognition
CN109101475A (zh) * 2017-06-20 2018-12-28 北京嘀嘀无限科技发展有限公司 出行语音识别方法、***和计算机设备
CN107993654A (zh) * 2017-11-24 2018-05-04 珠海格力电器股份有限公司 一种语音指令识别方法及***
CN108804070A (zh) * 2018-05-30 2018-11-13 Oppo广东移动通信有限公司 音乐播放方法、装置、存储介质及电子设备
CN111276147A (zh) * 2019-12-30 2020-06-12 天津大学 一种基于语音输入的饮食记录方法
CN114333828A (zh) * 2022-03-08 2022-04-12 深圳市华方信息产业有限公司 用于数码产品的快速语音识别***

Also Published As

Publication number Publication date
CN106205613B (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN106205613A (zh) 一种导航语音识别方法及***
US11341970B2 (en) Personal directory service
US7979425B2 (en) Server-side match
CN102543082B (zh) 使用自然语言的车载信息服务***语音操作方法及***
US7890326B2 (en) Business listing search
US8041568B2 (en) Business listing search
US20080130699A1 (en) Content selection using speech recognition
CN103730115A (zh) 一种语音中检测关键词的方法和装置
US20120296865A1 (en) Terminal device and word stock update method thereof
CN102968987A (zh) 一种语音识别方法及***
CN103885949A (zh) 一种基于歌词的歌曲检索***及其检索方法
JP2008047101A (ja) 自然言語ベースのロケーション・クエリー・システム、キーワード・ベースのロケーション・クエリー・システム、及び自然言語ベース/キーワード・ベースのロケーション・クエリー・システム
CN101019121A (zh) 对存储在数据库中的文档编制索引和进行检索的方法和***
CN107992523B (zh) 移动应用的功能选项查找方法及终端设备
CN104462105A (zh) 中文分词方法、装置和服务器
Ng Information fusion for spoken document retrieval
US7379973B2 (en) Computer-implemented voice application indexing web site
CN112382276A (zh) 一种基于语音语义识别的电网物料信息采集方法及装置
CN101261132A (zh) 在地图导航产品中实现语音、按键闪烁提示引导用户使用导航软件功能的方法
CN202534344U (zh) 使用自然语言的车载信息服务***语音操作***
US20090265162A1 (en) Method for Retrieving Items Represented by Particles from an Information Database
CN109344342B (zh) 地图数据检索方法、装置、检索服务器及***
CN108831473B (zh) 一种音频处理方法及装置
CN104063500A (zh) 信息处理设备以及信息处理方法
CN114462364B (zh) 录入信息的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190730

Address after: Room B512, Room 510000, Fifth Floor, 173 Jiangnan Avenue Middle Road, Haizhu District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Maitu Information Technology Co.,Ltd.

Address before: 518000 Pingshan Industrial Park, Taoyuan Street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN ZHIMOU TECHNOLOGY CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Room 1708, No. 180 Jiangnan Avenue Middle, Haizhu District, Guangzhou City, Guangdong Province, 510000 (office only)

Patentee after: Guangzhou Maitu Information Technology Co.,Ltd.

Address before: Room B512, 5th Floor, No. 173 Jiangnan Avenue Middle Road, Haizhu District, Guangzhou City, Guangdong Province, 510000

Patentee before: Guangzhou Maitu Information Technology Co.,Ltd.

CP02 Change in the address of a patent holder