CN106782492A - 一种基于Android的盲人语音导航*** - Google Patents

一种基于Android的盲人语音导航*** Download PDF

Info

Publication number
CN106782492A
CN106782492A CN201710085370.3A CN201710085370A CN106782492A CN 106782492 A CN106782492 A CN 106782492A CN 201710085370 A CN201710085370 A CN 201710085370A CN 106782492 A CN106782492 A CN 106782492A
Authority
CN
China
Prior art keywords
voice
module
converted
blind person
core processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710085370.3A
Other languages
English (en)
Inventor
吴双竞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Golden Cat Digital Technology Co Ltd
Original Assignee
Anhui Golden Cat Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Golden Cat Digital Technology Co Ltd filed Critical Anhui Golden Cat Digital Technology Co Ltd
Priority to CN201710085370.3A priority Critical patent/CN106782492A/zh
Publication of CN106782492A publication Critical patent/CN106782492A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种基于Android的盲人语音导航***,该盲人语音导航***通过调用语音交互模块实现和用户语音交互,然后通过调用讯飞语音平台将交互的语音信息转换成文本信息,又通过位置获取模块获取当前位置,进而通过路径计算模块计算出最优路径,最后再通过讯飞语音平台将文本的路径信息转换成语音的路径信息,最终实现了和用户的纯语音交互,来实现纯语音导航,极大的方便了盲人出行,并且能够通过语音识别和导航路径规划节省了大量时间,以提高效率和盲人的出行安全。

Description

一种基于Android的盲人语音导航***
技术领域
本发明涉及计算机术领域,特别是涉及一种基于Android的盲人语音导航***。
背景技术
随着经济发展和社会文明程度的不断提高,,人们对于出行的方便与自身位置的确定的要求明显加强,车载导航***正是应运而生。它是利用全球定位***(GPS)结合电子地图来进行导航,是具有GPS全球卫星定位***功能的导航仪,能方便并且准确地告诉驾驶者去往目的地的最快路径。2009年第一款Android手机问世至今,推动了智能手机的迅速发展,Android***凭借其开源免费的特性,已经普及到广大用户群体中,目前安卓手机的用户数已经达到了智能手机总用户数的80%。正是由于智能手机的普及,GPS芯片已经是智能手机上不可缺少的一部分,各种基于手机GPS功能的导航地图也层出不穷,人们不再需要额外付出就能享受快速准确的定位服务,方便日常出行,体验到与车载导航***一样的导航服务。目前盲人平时出行不便的问题越来越受到广大人群的关注和重视,而对于视力障碍的盲人来说,使用传统的按键等方式操作嵌入式电子产品显得不尽人意。已经面世的盲人导航***大多基于超声波识别***,现有的超声波导盲产品往往只能够判别出前方是否有障碍以及障碍的距离,而这些在实际使用过程中,都存在一些不足之处,存在安全隐患和导盲的精确性问题。如果能够把语音识别技术加入到导航***当中,使原本需要手动输入的导航目的地名称由语音输入方式来代替,实现语音控制嵌入式导航设备。这种自然快捷的交互方式,使得人性化特征的优越性得到充分的展现,必将得到社会广泛的欢迎。现在的移动技术的迅速发展,新一代的手机智能操作***Android得到广泛应用,盲人对于手机的导航***的需求也迫切增高,但现在可为盲人服务的基于Android的手机导航***技术还不成熟,需要不断完善。本文着手于为盲人开发一款手机导航软件,在基于Android智能手机操作***的平台上,利用语音识别、语音合成等功能,为盲人提供便利的服务。
目前,我国的一些大中型城市在主要街道都铺设了盲道,政府也发放了盲杖,但现实生活中盲道和盲杖是无法满足盲人和低视力人群出行的多方位需求,因此社会和政府都希望开发出一种新型的产品能够满足视觉障碍人群出行的要求,进一步提高视觉障碍人群的生活水平,创建一个和谐稳定的生活环境。世界上已经开发出的盲人导航的产品,要么价格过于昂贵,要么并不能真正意义上解决盲人出行难的问题,例如加拿大魁北克省一家公司开发的盲人手持GPS(Trekr)可以帮助盲人在户外做自由而安全的散步,但是它的市价为900美元,远远超出了一般盲人所能承担的极限。格鲁吉亚的一个技术研究小组也发明了一套服装类的电子***,该***装在背包中,包含了内置GPS导航、RFID、射频传感器等装置,头上戴的帽子是用于辨别前方障碍物的设备,但同样是价格昂贵。如今,语音识别技术已经发展成为涉及统计模式识别、声学、数字信号处理语言学、等多种学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别***在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。一个语音识别***整体上包括两大部分:训练和识别。训练是在布置好的服务器上完成,对预先收集好的大量语音、语言数据库进行机器学习,提取语音特征,然后训练成对应的“语音模型”和“声学模型”。识别则是有用户的客户端与服务端共同完成,客户端收集用户的语音信息,对初始的信息进行预处理,例如:去除非说话声、特诊提取、降噪等,然后把处理过的信息发送给服务端。服务端则对收到的语音信息进行语音识别,具体是用已经训练好的“语音模型”和“升学模型”对语音数据的特征向量进行解码,获取其中包含的文字信息,然后对获取的信息“修补”,使其符合我们说话的正常逻辑,最后把结果返回给客户端。同时服务端会把这部分数据加入到自己的训练库中,作为一个训练结果的反馈信息,利用反馈信息,可以将识别结果校正,从而提高识别率。
发明内容
本发明的目的是提供一种基于Android的盲人语音导航***。
本发明的目的可以通过以下技术方案实现:
一种基于Android的盲人语音导航***,包括语音交互模块、位置获取模块、核心处理模块以及路径计算模块;
所述的语音交互模块,用于实现语音交互功能,通过收集语音信息并对生成的语音文件进行初步的语音降噪,继而将语音文件转换成指定格式,完成语音信息的采集,采集完成后将语音文件交给核心处理模块;将从核心处理模块获取的指定格式的语音文件播放出去,从而实现语音信息的推送;
所述的位置获取模块,通过调用android***的位置接口API来获取用户的当前地理位置的经纬度,然后将获取的地理位置信息交给路径计算模块;
所述的核心处理模块,用于实现总体的任务调度和参数传递,从语音交互模块获取格式化的语音文件;通过调用讯飞语音接口将语音信息转化为文本信息;从获取的文本信息中提取目标位置关键信息;将提取的目标位置转换为经纬度坐标参数;将目标位置的参数传递给路径计算模块;从路径计算模块获取路径信息;通过调用讯飞语音接口将路径信息转换为语音信息;将转换为语音的路径信息传递给语音交互模块;
所述的路径计算模块,用于实现路径计算功能,从核心处理模块获得用户的目标位置,从位置获取模块获得用户的当前位置,以当前位置和目标位置为参数计算出最优路径和最短路径供用户选择,然后将计算好的路径交给核心处理模块。
本发明的有益效果:
本发明所提供的一种基于Android的盲人语音导航***,该盲人语音导航***通过调用语音交互模块实现和用户语音交互,然后通过调用讯飞语音平台将交互的语音信息转换成文本信息,又通过位置获取模块获取当前位置,进而通过路径计算模块计算出最优路径,最后再通过讯飞语音平台将文本的路径信息转换成语音的路径信息,最终实现了和用户的纯语音交互,来实现纯语音导航,极大的方便了盲人出行,并且能够通过语音识别和导航路径规划节省了大量时间,以提高效率和盲人的出行安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明的***示意图;
具体实施方式
本发明的核心是提供一种基于Android的盲人语音导航***。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于Android的盲人语音导航***,包括语音交互模块、位置获取模块、核心处理模块、路径计算模块。
所述的语音交互模块,实现语音交互功能,包含两步:第一步通过收集语音信息并对生成的语音文件进行初步的语音降噪,继而将语音文件转换成指定格式,从而完成语音信息的采集,采集完成后将语音文件交给核心处理模块;第二部将从核心处理模块获取的指定格式的语音文件播放出去,从而实现语音信息的推送;这两步功能联合实现语音交互功能。
所述的位置获取模块,通过调用android***的位置接口API来获取用户的当前地理位置的经纬度,然后将获取的地理位置信息交给路径计算模块。
所述的核心处理模块,实现了总体的任务调度和参数传递,通过以下步骤实现:
步骤a:从语音交互模块获取格式化的语音文件;
步骤b:通过调用讯飞语音接口将语音信息转化为文本信息;
步骤c:从步骤b获取的文本信息中提取关键信息,如目标位置;
步骤d:将提取的目标位置转换为经纬度坐标参数;
步骤e:将目标位置的参数传递给路径计算模块;
步骤f:从路径计算模块获取路径信息;
步骤g:通过调用讯飞语音接口将路径信息转换为语音信息;
步骤h:将转换为语音的路径信息传递给语音交互模块。
所述的步骤abcdefgh不是严格按照顺序试行,而是通过任务调用智能执行。
所述的路径计算模块,实现路径计算功能,具体功能实现为从核心处理模块获得用户的目标位置,从位置获取模块获得用户的当前位置,以当前位置和目标位置为参数计算出最优路径和最短路径供用户选择,然后将计算好的路径交给核心处理模块。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.一种基于Android的盲人语音导航***,其特征在于,包括语音交互模块、位置获取模块、核心处理模块以及路径计算模块;
所述的语音交互模块,用于实现语音交互功能,通过收集语音信息并对生成的语音文件进行初步的语音降噪,继而将语音文件转换成指定格式,完成语音信息的采集,采集完成后将语音文件交给核心处理模块;将从核心处理模块获取的指定格式的语音文件播放出去,从而实现语音信息的推送;
所述的位置获取模块,通过调用android***的位置接口API来获取用户的当前地理位置的经纬度,然后将获取的地理位置信息交给路径计算模块;
所述的核心处理模块,用于实现总体的任务调度和参数传递,从语音交互模块获取格式化的语音文件;通过调用讯飞语音接口将语音信息转化为文本信息;从获取的文本信息中提取目标位置关键信息;将提取的目标位置转换为经纬度坐标参数;将目标位置的参数传递给路径计算模块;从路径计算模块获取路径信息;通过调用讯飞语音接口将路径信息转换为语音信息;将转换为语音的路径信息传递给语音交互模块;
所述的路径计算模块,用于实现路径计算功能,从核心处理模块获得用户的目标位置,从位置获取模块获得用户的当前位置,以当前位置和目标位置为参数计算出最优路径和最短路径供用户选择,然后将计算好的路径交给核心处理模块。
CN201710085370.3A 2017-02-17 2017-02-17 一种基于Android的盲人语音导航*** Pending CN106782492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710085370.3A CN106782492A (zh) 2017-02-17 2017-02-17 一种基于Android的盲人语音导航***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710085370.3A CN106782492A (zh) 2017-02-17 2017-02-17 一种基于Android的盲人语音导航***

Publications (1)

Publication Number Publication Date
CN106782492A true CN106782492A (zh) 2017-05-31

Family

ID=58957916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710085370.3A Pending CN106782492A (zh) 2017-02-17 2017-02-17 一种基于Android的盲人语音导航***

Country Status (1)

Country Link
CN (1) CN106782492A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107456362A (zh) * 2017-07-14 2017-12-12 武汉理工大学 一种盲人出行智能导航***及方法
CN109540160A (zh) * 2018-10-18 2019-03-29 深圳壹账通智能科技有限公司 一种基于语音交互的最佳路径分析方法及相关设备
CN111089603A (zh) * 2018-10-23 2020-05-01 上海博泰悦臻电子设备制造有限公司 基于社交应用沟通内容的导航信息提示方法及车辆
WO2020114214A1 (zh) * 2018-12-06 2020-06-11 深圳前海达闼云端智能科技有限公司 导盲方法和装置,存储介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201251445Y (zh) * 2008-09-08 2009-06-03 众智瑞德科技(北京)有限公司 一种语音导盲***及便携式语音导盲装置
CN102435202A (zh) * 2011-12-01 2012-05-02 广西卫通汽车信息技术有限公司 云端语音导航的方法和装置
CN202471084U (zh) * 2012-01-19 2012-10-03 深圳市飞沃达通信设备有限公司 一种基于Android平台的导航仪
CN103226018A (zh) * 2013-04-03 2013-07-31 广东欧珀移动通信有限公司 基于移动终端的导盲方法及移动终端
CN104615052A (zh) * 2015-01-15 2015-05-13 深圳乐投卡尔科技有限公司 Android车载导航全局声控装置及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201251445Y (zh) * 2008-09-08 2009-06-03 众智瑞德科技(北京)有限公司 一种语音导盲***及便携式语音导盲装置
CN102435202A (zh) * 2011-12-01 2012-05-02 广西卫通汽车信息技术有限公司 云端语音导航的方法和装置
CN202471084U (zh) * 2012-01-19 2012-10-03 深圳市飞沃达通信设备有限公司 一种基于Android平台的导航仪
CN103226018A (zh) * 2013-04-03 2013-07-31 广东欧珀移动通信有限公司 基于移动终端的导盲方法及移动终端
CN104615052A (zh) * 2015-01-15 2015-05-13 深圳乐投卡尔科技有限公司 Android车载导航全局声控装置及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107456362A (zh) * 2017-07-14 2017-12-12 武汉理工大学 一种盲人出行智能导航***及方法
CN109540160A (zh) * 2018-10-18 2019-03-29 深圳壹账通智能科技有限公司 一种基于语音交互的最佳路径分析方法及相关设备
CN111089603A (zh) * 2018-10-23 2020-05-01 上海博泰悦臻电子设备制造有限公司 基于社交应用沟通内容的导航信息提示方法及车辆
WO2020114214A1 (zh) * 2018-12-06 2020-06-11 深圳前海达闼云端智能科技有限公司 导盲方法和装置,存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN106782492A (zh) 一种基于Android的盲人语音导航***
CN107451276A (zh) 一种基于深度学习的智能自助导游***及其方法
CN103970861B (zh) 信息呈现方法和设备
Ginters Augmented reality use for cycling quality improvement
CN108491421A (zh) 一种生成问答的方法、装置、设备和计算存储介质
CN102142215A (zh) 一种顾及位置与速度的地理信息自适应语音讲解方法
CN105640748A (zh) 一种振动导盲衣服
CN107742474B (zh) 一种景区用智慧旅游路牌***及其使用方法
CN116797684A (zh) 图像生成方法、装置、电子设备及存储介质
CN106643774A (zh) 一种导航路线生成方法及终端
CN202061036U (zh) 物联网环境下的盲人导航***
EP3244166B1 (en) System and method for identifying socially relevant landmarks
CN106372203A (zh) 一种智能终端的信息响应方法、装置和智能终端
CN107076562A (zh) 测量(鸟瞰)型导航***
CN107289952A (zh) 室内双向导航方法
CN115147248B (zh) 一种基于大数据的旅游信息咨询***和方法
CN109009902A (zh) 导盲杖及导盲方法
CN111611812A (zh) 翻译成盲文
JP2014228952A (ja) 情報提供システム及びその方法及びプログラム
CN111578965B (zh) 导航播报信息处理方法、装置、电子设备和存储介质
CN111353470B (zh) 图像的处理方法、装置、可读介质和电子设备
CN107248121A (zh) 一种基于微信客服接口的智能导游助手***
CN109540160A (zh) 一种基于语音交互的最佳路径分析方法及相关设备
CN105243630B (zh) 一种基于可配置流程的应急事件处置方法
CN210244428U (zh) 一种基于大数据的偏好旅行***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication