CN114242061A - 一种基于语音识别的订单派发方法及*** - Google Patents
一种基于语音识别的订单派发方法及*** Download PDFInfo
- Publication number
- CN114242061A CN114242061A CN202111619643.0A CN202111619643A CN114242061A CN 114242061 A CN114242061 A CN 114242061A CN 202111619643 A CN202111619643 A CN 202111619643A CN 114242061 A CN114242061 A CN 114242061A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- order
- recognition
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005516 engineering process Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000012805 post-processing Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于语音识别的订单派发方法及***,通过将客户端录制的语音信息上传到云端服务器进行语音识别预处理,获取到地址文本信息;对获取到的地址文本信息进行逆解析得到地址信息,生成订单派发至驾驶终端即可进行代驾服务。本发明应用语音技术进行代驾下单,为人们的工作和生活提供了很大便利,尤其是针对老人、儿童、醉酒人员或其他不便打字输入代驾信息的人员,简化繁琐步骤,依靠一条语音指令完成代驾下单,提高用户体验,实用性强,推广性高。
Description
技术领域
本发明涉及一种基于语音识别的订单派发方法及***,属于代驾服务技术领域。
背景技术
目前,代驾客户一般通过输入起始地和目的地完成下单,给醉酒人员、老年人或其它一些不便输入订单信息的人员带来不便。而驾驶终端接单后需要对应查看订单信息,同时由于代驾订单繁多、地址信息多种多样,导致驾驶员经常一边开车,一边时常查看订单信息、规划导航路线。分散驾驶员的注意力,存在较大的行车安全隐患。
近年来,语音识别技术发展非常迅速,识别能力得到了很大的提高,语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。目前,常用的说话人识别方法有模板匹配法、统计建模法、联接主义法(即人工神经网络实现)。语音识别是一项融合多学科知识的前沿技术,覆盖了数学与统计学、声学与语言学、计算机与人工智能等基础学科和前沿学科,是人机自然交互技术中的关键环节。随着技术的发展,现在口音、方言、噪声等场景下的语音识别也达到了可用状态,随机模型法目前应用较为成熟,该方法主要采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别。目前的语音识别技术主要包括特征参数提取技术、模式匹配及模型训练技术。特征提取技术是将语音信号中有用的特征参数信息从所有信息中提取出来的技术。通过分析处理,删除冗余信息,留下关键信息。模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。
故将语音识别技术应用于代驾服务,以提升用户快速下单体验是亟待解决的问题。
发明内容
鉴于此,本发明的目的是提供一种基于语音识别的订单派发方法及***,可以克服现有技术的不足。
本发明的目的是通过以下技术方案实现的:
一种基于语音识别的订单派发方法,其包括以下步骤:
s1、客户端上传语音信息到云端服务器进行语音识别预处理,获取到地址文本信息;
s2、对获取到的地址文本信息进行逆解析得到地址信息,生成订单派发至驾驶终端。
前述步骤s1中,采用语音识别技术将客户端上传的语音信息转换为地址文本信息;
所述语音识别技术采用模式匹配原理:首先对输入语音进行预处理,再提取并选择合适的特征参数,通过学习模型把输入的语音按一定模式进行分类,进而依据判定准则找出相匹配的字词。
通过模型训练技术得到声学模型和语言模型,提取出合适的声学特征参数,将声学特征参数中的语音特征序列转化为字词。
前述语音预处理的具体步骤为:
s1-1、语音活动监测,检测出语音信号的起始位置,分离出语音段和非语音段;
s1-2、降噪,通过降噪算法对语音环境中存在的各种噪声进行降噪处理,提高信噪比;
s1-3、回声消除,通过自适应滤波器,模拟回声产生的信道环境,进而估计回声信号进行回声消除。
前述步骤s2中,对语音识别的字词信息进行地址分类识别,解析得到起始地和目的地信息,通过GPS定位技术将驾驶终端当前位置信息系用户的起始地、目的地信息转换成地址经纬度信息,生成导航路径。
一种基于语音识别的订单派发***,其包括部署在云端服务器的语音识别模块、地址识别模块和订单调度模块;各模块与客户端、驾驶终端电信连接,
所述语音识别模块用于接收客户端客户下单时录入的语音信息,对语音进行信号处理,提取出合适的声学特征参数,并将语音特征序列转化为字词;
所述地址识别模块用于处理语音识别模块后处理信息,对语音识别字词信息进行地址分类识别,标识出起始地和目的地,转换地址经纬度信息传输到订单调度模块;
所述订单调度模块用于接收处理地址信息,完成下单和订单派发至驾驶终端。
前述客户端包括包括具有代驾APP的智能手机、PAD,其通过录入语音信息进行下单。
前述驾驶终端包括具有GPS定位导航功能的智能手机、PAD、车载设备或其他智能移动终端。
与现有技术比较,本发明公开的一种基于语音识别的订单派发方法及***,客户端可以通过录制语音信息进行代驾下单,具体将客户端录制的语音信息上传到云端服务器进行语音识别预处理,获取到地址文本信息;对获取到的地址文本信息进行逆解析得到地址信息,生成订单派发至驾驶终端即可进行代驾服务。语音识别技术发展至今,在识别精度上已经达到了相当高的水平。尤其是中小词汇量对非特定人语音识别***识别精度已经大于98%,而对特定人语音识别精度更高。现如今的语音识别准确度已经能够满足人们日常应用的需求,很多手机、电脑都已经带有语音识别功能,十分便利。本发明应用语音技术进行代驾下单,为人们的工作和生活提供了很大便利,尤其是针对老人、儿童、醉酒人员或其他不便打字输入代驾信息的人员,简化繁琐步骤,依靠一条语音指令完成代驾下单,提高用户体验。另外通过GPS定位技术在驾驶终端可以直接获取导航路径,进行代驾服务,提高行车安全性,实用性强,推广性高。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明的***流程示意图。
图2为语音序列转换为文本序列***框架模型。
具体实施方式
以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
如图1-图2所示,一种基于语音识别的订单派发方法,其包括以下步骤:
s1、客户端上传语音信息到云端服务器进行语音识别预处理,获取到地址文本信息;
s2、对获取到的地址文本信息进行逆解析得到地址信息,生成订单派发至驾驶终端。
步骤s1中,采用语音识别技术将客户端上传的语音信息转换为地址文本信息。
所述语音识别技术采用模式匹配原理:首先对输入语音进行预处理,再提取并选择合适的特征参数,通过学习模型把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
通过模型训练技术得到声学模型和语言模型,提取出合适的声学特征参数,将声学特征参数中的语音特征序列转化为字词。
所述语音预处理的具体步骤为:
s1-1、语音活动监测,检测出语音信号的起始位置,分离出语音段和非语音(静音或噪声)段;
s1-2、降噪,通过降噪算法对语音环境中存在的各种噪声进行降噪处理,提高信噪比,进一步提升识别效果;
s1-3、回声消除,通过自适应滤波器,模拟回声产生的信道环境,进而估计回声信号进行回声消除。
步骤s2中,对语音识别的字词信息进行地址分类识别,解析得到起始地和目的地信息,通过GPS定位技术将驾驶终端当前位置信息系用户的起始地、目的地信息转换成地址经纬度信息,生成导航路径,驾驶员根据相应的导航路径即可行驶前往目的地。
一种基于语音识别的订单派发***,包括部署在云端服务器的语音识别模块、地址识别模块和订单调度模块;各模块与客户端、驾驶终端电信连接,
所述语音识别模块用于接收客户端客户下单时录入的语音信息,对语音进行信号处理,提取出合适的声学特征参数,并将语音特征序列转化为字词;
所述地址识别模块用于处理语音识别模块后处理信息,对语音识别字词信息进行地址分类识别,标识出起始地和目的地,转换地址经纬度信息传输到订单调度模块;
所述订单调度模块用于接收处理地址信息,完成下单和订单派发至驾驶终端。
所述客户端包括包括具有代驾APP的智能手机、PAD,其通过录入语音信息进行下单。
所述驾驶终端包括具有GPS定位导航功能的智能手机、PAD、车载设备或其他智能移动终端。
语音识别技术发展至今,在识别精度上已经达到了相当高的水平。尤其是中小词汇量对非特定人语音识别***识别精度已经大于98%,而对特定人语音识别精度更高。现如今的语音识别准确度已经能够满足人们日常应用的需求,很多手机、电脑都已经带有语音识别功能,十分便利。语音识别技术的发展为人们的工作和生活都提供了便利,简化繁琐步骤依靠一条语音指令完成代驾下单提高平台客户体验。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式保密的限制,任何未脱离本发明技术方案内容、依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (8)
1.一种基于语音识别的订单派发方法,其特征在于,包括以下步骤:
s1、客户端上传语音信息到云端服务器进行语音识别预处理,获取到地址文本信息;
s2、对获取到的地址文本信息进行逆解析得到地址信息,生成订单派发至驾驶终端。
2.根据权利要求1所述的基于语音识别的订单派发方法,其特征在于:步骤s1中,采用语音识别技术将客户端上传的语音信息转换为地址文本信息;
所述语音识别技术采用模式匹配原理:首先对输入语音进行预处理,再提取并选择合适的特征参数,通过学习模型把输入的语音按一定模式进行分类,进而依据判定准则找出相匹配的字词。
3.根据权利要求2所述的基于语音识别的订单派发方法,其特征在于:通过模型训练技术得到声学模型和语言模型,提取出合适的声学特征参数,将声学特征参数中的语音特征序列转化为字词。
4.根据权利要求3所述的基于语音识别的订单派发方法,其特征在于:所述语音预处理的具体步骤为:
s1-1、语音活动监测,检测出语音信号的起始位置,分离出语音段和非语音段;
s1-2、降噪,通过降噪算法对语音环境中存在的各种噪声进行降噪处理,提高信噪比;
s1-3、回声消除,通过自适应滤波器,模拟回声产生的信道环境,进而估计回声信号进行回声消除。
5.根据权利要求2所述的基于语音识别的订单派发方法,其特征在于:步骤s2中,对语音识别的字词信息进行地址分类识别,解析得到起始地和目的地信息,通过GPS定位技术将驾驶终端当前位置信息系用户的起始地、目的地信息转换成地址经纬度信息,生成导航路径。
6.一种基于语音识别的订单派发***,其特征在于:包括部署在云端服务器的语音识别模块、地址识别模块和订单调度模块;各模块与客户端、驾驶终端电信连接,
所述语音识别模块用于接收客户端客户下单时录入的语音信息,对语音进行信号处理,提取出合适的声学特征参数,并将语音特征序列转化为字词;
所述地址识别模块用于处理语音识别模块后处理信息,对语音识别字词信息进行地址分类识别,标识出起始地和目的地,转换地址经纬度信息传输到订单调度模块;
所述订单调度模块用于接收处理地址信息,完成下单和订单派发至驾驶终端。
7.根据权利要求6所述的基于语音识别的订单派发***,其特征在于:所述客户端包括包括具有代驾APP的智能手机、PAD,其通过录入语音信息进行下单。
8.根据权利要求6所述的基于语音识别的订单派发***,其特征在于:所述驾驶终端包括具有GPS定位导航功能的智能手机、PAD、车载设备或其他智能移动终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111619643.0A CN114242061A (zh) | 2021-12-28 | 2021-12-28 | 一种基于语音识别的订单派发方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111619643.0A CN114242061A (zh) | 2021-12-28 | 2021-12-28 | 一种基于语音识别的订单派发方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114242061A true CN114242061A (zh) | 2022-03-25 |
Family
ID=80764011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111619643.0A Pending CN114242061A (zh) | 2021-12-28 | 2021-12-28 | 一种基于语音识别的订单派发方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114242061A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115361473A (zh) * | 2022-10-20 | 2022-11-18 | 深圳市人马互动科技有限公司 | 基于用户语音信息的代驾呼叫方法及相关产品 |
-
2021
- 2021-12-28 CN CN202111619643.0A patent/CN114242061A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115361473A (zh) * | 2022-10-20 | 2022-11-18 | 深圳市人马互动科技有限公司 | 基于用户语音信息的代驾呼叫方法及相关产品 |
CN115361473B (zh) * | 2022-10-20 | 2023-01-24 | 深圳市人马互动科技有限公司 | 基于用户语音信息的代驾呼叫方法及相关产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
CN1119794C (zh) | 分布式话音识别*** | |
CN107945790B (zh) | 一种情感识别方法和情感识别*** | |
CN101071564B (zh) | 把词表外语音与词表内语音区别开的方法 | |
CN102693725A (zh) | 依赖于文本信息语境的语音识别 | |
CN102097096B (zh) | 在语音识别后处理过程中使用音调来改进识别精度 | |
CN108564942A (zh) | 一种基于敏感度可调的语音情感识别方法及*** | |
CN107657017A (zh) | 用于提供语音服务的方法和装置 | |
CN110348002A (zh) | 实现语音请求的***和方法 | |
CN108833722A (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
CN110232912A (zh) | 语音识别仲裁逻辑 | |
CN106816149A (zh) | 车辆自动语音识别***的优先化内容加载 | |
CN108074576A (zh) | 审讯场景下的说话人角色分离方法及*** | |
CN110491414A (zh) | 使用动态可调监听超时的自动语音识别 | |
CN107819929A (zh) | 优选表情符号的识别和生成 | |
CN1856820A (zh) | 语音识别方法和通信设备 | |
CN109256150A (zh) | 基于机器学习的语音情感识别***及方法 | |
US8374868B2 (en) | Method of recognizing speech | |
CN110600014B (zh) | 一种模型训练方法、装置、存储介质及电子设备 | |
CN1941079A (zh) | 语音识别方法和*** | |
CN109785827A (zh) | 在语音识别仲裁中使用的神经网络 | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
CN110600032A (zh) | 一种语音识别方法及装置 | |
KR102312993B1 (ko) | 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치 | |
CN113129867A (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |