CN101009095A - 全自动智能盲用阅读器 - Google Patents

全自动智能盲用阅读器 Download PDF

Info

Publication number
CN101009095A
CN101009095A CNA2007100668427A CN200710066842A CN101009095A CN 101009095 A CN101009095 A CN 101009095A CN A2007100668427 A CNA2007100668427 A CN A2007100668427A CN 200710066842 A CN200710066842 A CN 200710066842A CN 101009095 A CN101009095 A CN 101009095A
Authority
CN
China
Prior art keywords
module
unit
key
fully
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007100668427A
Other languages
English (en)
Inventor
蒋清晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2007100668427A priority Critical patent/CN101009095A/zh
Publication of CN101009095A publication Critical patent/CN101009095A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种全自动智能盲用阅读器。其内部模块连接关系为:阅读控制单元分别与扫描输入单元、图像处理单元、文字识别单元、智能判别单元、语音合成单元、发音单元相接,存储单元分别与扫描输入单元、图像处理单元、智能判别单元、语音合成单元相接。本发明可以全自动的辅助盲人进行书刊、报纸、文件等纸制文字资料的阅读,避免了盲人因看不见而无法进行复杂操作的情况,可在盲人无法辨别纸制文件放置方向和角度的情况下准确进行阅读,更有方便的阅读控制功能,使盲人阅读进行的更方便和高效率。

Description

全自动智能盲用阅读器
技术领域
本发明总体设计用于盲人及视力障碍人士用于文字语音转化的全自动智能阅读设备。属于信息电子技术领域,是信息无障碍的残疾人辅助用具。
背景技术
盲人及视力障碍人士是社会的弱势群体,视觉能力的缺失使他们无法以最直观的方式获取信息。现在世界上大部分的文字信息均以视觉的方式表达,盲人只能通过盲文和语音的方式来识别文字获取信息。然而现实生活中,99%以上的文字信息资料都是以视力障碍人士无法阅读的纸制资料形式出现的,盲人在无视力正常人士辅助下是完全无法获取这些信息的,纸制资料信息成为了盲人及视力障碍人士参与现实社会活动的巨大障碍,也造成了现实生活中盲人及视力障碍人群文化水平相对低下的严重后果。
现在盲人及视力障碍人士获取文字信息的方式主要有:①通过计算机辅助软件的形式把电子文字信息转化为语音②通过辅助设备将纸制文字资料转化为可触摸感知的信息③通过辅助设备将纸制文字资料信息转化为语音信息每种方式各有其优缺点,第一种方式对于纸制资料如期刊报纸文件等等无法进行处理,第二种方式使用者需要经过复杂而***的训练,。第三种方式可以直接将文字资料信息转化为语音信息,甚至对于不识字的盲人及视力障碍人士,也可以使用,是目前而言最为优秀的信息获取方式。
然而现在的大部分文字语音转换设备均存在以下的问题:首先,操作相当复杂,对于视力正常的人士而言使用已经很费力,更何况对于视力有障碍的人;其次,对于盲人而言,因为他们无法感知纸制资料上的文字印刷的方向,因此在阅读过程中会经常发生放置错误的情况,当前的文字语音转换设备无法智能判断纸制资料的放置情况,给盲人使用造成了很大障碍;最后,在阅读过程中,这些设备均无法提供很好的阅读控制***,给实际使用造成了很大的困难。
因此,很需要一种能够辅助盲人及视力障碍人士在没有正常人帮助情况下也能够很方便的实现纸制文字资料信息阅读的技术。
发明内容
本发明的目的是提供一种全自动智能盲用阅读器。
全自动智能盲用阅读器的内部模块连接关系为:阅读控制单元分别与扫描输入单元、图像处理单元、文字识别单元、智能判别单元、语音合成单元、发音单元相接,存储单元分别与扫描输入单元、图像处理单元、智能判别单元、语音合成单元相接。
所述的阅读控制单元包括阅读控制器模块和***控制模块,阅读控制器模块和***控制模块内部模块连接关系为:阅读器键盘与USB键盘控制器芯片、第一USB端口、第二USB端口***流程自动控制模块、语音提示控制模块相接。
阅读器键盘按键共有8个,分别是启动朗读键、朗读暂停键、读下一句键、读上一句键、变声键、朗读加速键、朗读减速键和复位键。
文字识别单元内部模块连接关系为:图像切分模块与字符特征提取模块、结果输出模块、标准特征库模块相接。
智能判断单元内部模块连接关系为:标准词库模块与文义智能判断查找模块、统计判别模块、输出模块相接。
图像处理单元内部模块连接关系为:去噪声模块与亮度对比度调节模块、图像旋转模块相接。
语音合成单元和发音单元内部模块连接关系为:文字语音转换模块和控制命令语音存储模块与变声变调模块、扬声器相接。
本发明可以全自动的辅助盲人进行书刊、报纸、文件等纸制文字资料的阅读,避免了盲人因看不见而无法进行复杂操作的情况,可在盲人无法辨别纸制文件放置方向和角度的情况下准确进行阅读,更有方便的阅读控制功能,使盲人阅读进行的更方便和高效率。
附图说明
图1是全自动智能盲用阅读器的电路框图;
图2是本发明的阅读控制器的电路框图;
图3是本发明的阅读器键盘示意图;
图4是本发明的基于FPGA的电路框图;
图5是本发明的语音合成单元和发音单元结构图。
具体实施方式
如图1所示,全自动智能盲用阅读器包括扫描输入单元、阅读控制单元、文字识别单元、智能判断单元、图像处理单元、语音合成单元、存储单元和发音单元。阅读控制单元2分别与扫描输入单元1、图像处理单元5、文字识别单元3、智能判别单元4、语音合成单元6、发音单元相接8,存储单元7分别与扫描输入单元1、图像处理单元5、智能判别单元4、语音合成单元6相接。
扫描输入单元1主要由光学成像扫描头、机械传动机构以及控制和A/D转换处理电路组成。其中,光学成像扫描头由条形灯管灯源、三只条形平面反射镜、聚焦透镜(透镜组)和CCD电荷耦合器件组成。条形灯管和条形平面反射镜在扫描头上沿水平方向放置。工作时条形灯管发出的平行光线经纸制资料、条形平面反射镜反射后经聚焦透镜(或透镜组)进入CCD,由CCD将光信号转换为与光强度成正比的模拟电信号。机械传动机构由步进电机、传动齿轮、传动皮带组成。扫描头由圆形支撑滑杆支撑,卡在传动皮带上,由传动皮带带动沿支撑滑杆移动。A/D转换处理电路由A/D转换芯片和相应的外部电路组成,经过CCD转换的模拟电信号通过A/D转换处理电路变为表示纸制资料成像灰度的数字信号传送给存储单元(7)。
如图2所示,阅读控制单元由阅读控制器模块21和***控制模块22组成,阅读控制器模块21和***控制模块22内部模块连接关系为:阅读器键盘211与USB键盘控制器芯片212、第一USB端口213、第二USB端口223***流程自动控制模块222、语音提示控制模块221相接。
其中阅读控制器模块,其主要功能是接受使用者的指令,并将这一指令通过第一USB端口传送到***控制模块中去。阅读控制器模块主要由阅读器键盘、USB键盘控制器芯片和第一USB端口组成。因为本发明的使用者很多是盲人,因此在阅读器键盘外形设计上,使用外形相差很大的按键。
如图3所示,在本实施例中,阅读器键盘的按键共有8个,阅读的控制8个命令,每一个命令对应一个按键,分别是启动朗读键2111、朗读暂停键2112、读下一句键2113、读上一句键2114、变声键2115、朗读加速键2116、朗读减速键2117和复位键2118,USB键盘控制器芯片212采用了美国ATMEL公司的AT43USB324。使用者在阅读过程中的任何控制命令都由按键,经过USB键盘控制器芯片的编码,通过第一USB端口传送到***控制模块。***控制模块由***流程自动控制模块222和语音提示控制模块221组成。***流程自动控制模块负责控制整个***的运行,并发送当前***运行状态给语音提示控制模块。语音提示控制模块与语音合成单元6相连接,其主要功能是控制语音合成单元合成当前***运行状态的语音,从而提示用户当前***运行到哪一个状态。语音提示对于盲人使用者是非常重要的。在本实施例中,***流程自动控制模块和语音提示控制模块均基于FPGA实现
如图4所示在本实施例中,文字识别单元3、智能判断单元4、图像处理单元5和***流程自动控制模块222和语音提示控制模块221均基于FPGA实现,。
所述的文字识别单元3内部模块连接关系为:图像切分模块31与字符特征提取模块32、结果输出模块34、标准特征库模块33相接。智能判断单元4内部模块连接关系为:标准词库模块41与文义智能判断查找模块42、统计判别模块43、输出模块44相接。图像处理单元5内部模块连接关系为:去噪声模块51与亮度对比度调节模块52、图像旋转模块53相接。
本实施例中,FPGA采用Xilinx公司出品的Virtex-4系列的FPGAXC4VLX100,存储单元7由SRAM存储器K7N163601M实现。***流程自动控制模块控制整个***的流程,是本***的核心部分。在用户通过阅读控制器模块按下了启动键后,该模块可以在无需用户干预的情况下自动的控制***中的各个模块按照顺序操作,使纸制资料的文字信息转换为声音信号。并根据用户在阅读时的控制命令,调整操作流程,满足用户要求。在***按顺序操作,处于不同的状态时,***流程自动控制模块将当前状态的信息以及用户按键的信息传给语音提示控制模块,语音提示控制模块产生相应的语音提示控制信号控制语音合成模块,达到提示用户当前状态和用户按键结果的目的。
图像处理单元包括了去噪声模块51、亮度对比度调节模块52和图像旋转模块53。去噪声模块的主要功能是从存储单元中读取扫描输入单元存储的图像数据,并且去除图像中的噪声点,以提高文字识别的准确度。亮度对比度调节模块的主要功能是将去除噪声后的图像增强对比度,并根据图像本身的特性自适应的调整亮度,同样是为了增加识别率。图像旋转模块的主要功能是将图像旋转指定的角度后输出,这个角度可以是从0~360°中任意一个整数值的角度,和智能判断模块配合即可将以倾斜角度放置的纸制文字资料图像正确的识别出来。文字识别单元3主要包括图像切分模块31,字符特征提取模块32,标准特征库模块33和结果输出模块34。图像切分模块的主要功能是将经过图像处理单元处理后的图像按照单个文字的区域进行切分,这样图像信息就被分隔为若干块含有单个文字信息的小图片。字符特征提取模块按照既定的算法提取含有单个文字信息小图片中关于字符的特征信息,并将这一信息与标准特征库模块中的标准特征信息进行对比,选择最为接近的特征信息所在的标准字符做为识别结果。结果输出模块整合整幅图像中的识别结果信息,并传送给智能判断单元。
智能判断单元4包括标准词库模块41,文义智能判断查找模块42和统计判别模块43和输出模块44。标准词库模块中含有大量的汉语和英语的词库,是为文义智能判断查找模块提供智能判断的标准。文义智能判断查找模块对每一个由文字识别单元识别得出的识别结果文字在标准词库模块中查找所有的词,并且与识别结果中该字符的实际上下文进行比较,如果识别结果的实际上下文中都没有能够在标准词库模块中查找到相应的词语,那么就认为这个字不能成词,并将这一结果传给统计判别模块。统计判别模块统计识别结果全文中所有字符的成词率。经过大量的实践证明,如果一段文字中所有字符的加总成词数量除以文章的总字符数小于一定的数值,那么可以认为这段文字是无意义的乱码。在阅读过程中,如果使用者不慎将纸制文字资料放置方向弄错,那么虽然可以得出识别结论,但却是没有意义的乱码。经过统计识别模块的判断,可以得出该次扫描识别的结果是否有效的结论。如果结果有效,则通过输出模块输出识别结果给语音合成单元。否则,则通过***自动流程控制模块将图像进行旋转操作,并重新进行识别流程,直到图像旋转到该文档的正确位置,也就是最能够被识别的位置,该结果将输出至语音合成单元。
如图5所示,语音合成单元6主要包括文字语音转换模块61和控制命令语音存储模块62。文字语音转换模块的主要功能是将通过智能判断后的正确的文字信息转换为语音信号并传送给发音单元。控制命令语音存储模块受阅读控制单元的的控制,其内部存储了***各个流程和阅读控制器上各个按键的提示音,阅读控制单元传送指令,则控制语音存储模块将送出相应的提示音信号,该信号与文字语音转换模块输出的信号是叠加在一起后送出给发音单元的。本实施例中,文字语音转换模块使用了OSYN06188语音合成芯片,控制命令语音存储模块使用了AP89043语音芯片。
发音单元8由变声变调模块81和扬声器82组成,变声变调模块的主要作用是将语音合成单元输出的声音根据用户的需要进行实时的处理,如进行男女声切换和变调处理等等。变声变调模块采用了SD771D单芯片实时变音处理器。
尽管结合数量有限的实施例说明了本发明,本领域的熟练人员显然知道据此有许多修改和变体。后附的权利要求旨在包括这些符合本发明的真正精神和范围的修改和变体。

Claims (7)

1.一种全自动智能盲用阅读器,其特征在于,阅读控制单元(2)分别与扫描输入单元(1)、图像处理单元(5)、文字识别单元(3)、智能判别单元(4)、语音合成单元(6)、发音单元相接(8),存储单元(7)分别与扫描输入单元(1)、图像处理单元(5)、智能判别单元(4)、语音合成单元(6)相接。
2.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的阅读控制单元(2)包括阅读控制器模块(21)和***控制模块(22),阅读控制器模块(21)和***控制模块(22)内部模块连接关系为:阅读器键盘(211)与USB键盘控制器芯片(212)、第一USB端口(213)、第二USB端口(223)***流程自动控制模块(222)、语音提示控制模块(221)相接。
3.根据权利要求2所述的一种全自动智能盲用阅读器,其特征在于,所述的阅读器键盘(211)按键共有8个,分别是启动朗读键(2111)、朗读暂停键(2112)、读下一句键(2113)、读上一句键(2114)、变声键(2115)、朗读加速键(2116)、朗读减速键(2117)和复位键(2118)。
4.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的文字识别单元(3)内部模块连接关系为:图像切分模块(31)与字符特征提取模块(32)、结果输出模块(34)、标准特征库模块(33)相接。
5.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的智能判断单元(4)内部模块连接关系为:标准词库模块(41)与文义智能判断查找模块(42)、统计判别模块(43)、输出模块(44)相接。
6.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的图像处理单元(5)内部模块连接关系为:去噪声模块(51)与亮度对比度调节模块(52)、图像旋转模块(53)相接。
7.根据权利要求1所述的一种全自动智能盲用阅读器,其特征在于,所述的语音合成单元(6)和发音单元(8)内部模块连接关系为:文字语音转换模块(61)和控制命令语音存储模块(62)与变声变调模块(81)、扬声器(82)相接。
CNA2007100668427A 2007-01-24 2007-01-24 全自动智能盲用阅读器 Pending CN101009095A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007100668427A CN101009095A (zh) 2007-01-24 2007-01-24 全自动智能盲用阅读器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007100668427A CN101009095A (zh) 2007-01-24 2007-01-24 全自动智能盲用阅读器

Publications (1)

Publication Number Publication Date
CN101009095A true CN101009095A (zh) 2007-08-01

Family

ID=38697492

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007100668427A Pending CN101009095A (zh) 2007-01-24 2007-01-24 全自动智能盲用阅读器

Country Status (1)

Country Link
CN (1) CN101009095A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101639862B (zh) * 2009-09-08 2011-09-28 烟台朱葛软件科技有限公司 盲人获取网页图片链接或图片验证码的方法和***
CN102509479A (zh) * 2011-10-08 2012-06-20 沈沾俊 便携式文字识别发声阅读器及读取文字的方法
CN101753764B (zh) * 2008-12-17 2012-09-26 夏普株式会社 图像处理装置及方法、图像读取装置、图像发送装置
CN104599670A (zh) * 2015-01-30 2015-05-06 成都星炫科技有限公司 点读笔的语音识别方法
CN106205599A (zh) * 2016-06-28 2016-12-07 广东欧珀移动通信有限公司 控制方法、控制装置及电子装置
CN107678595A (zh) * 2017-09-30 2018-02-09 上海摩软通讯技术有限公司 盲文识别装置、终端设备和盲文识别方法
CN112908111A (zh) * 2021-01-30 2021-06-04 云知声智能科技股份有限公司 一种用于盲人的点读方法、装置及***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753764B (zh) * 2008-12-17 2012-09-26 夏普株式会社 图像处理装置及方法、图像读取装置、图像发送装置
CN101639862B (zh) * 2009-09-08 2011-09-28 烟台朱葛软件科技有限公司 盲人获取网页图片链接或图片验证码的方法和***
CN102509479A (zh) * 2011-10-08 2012-06-20 沈沾俊 便携式文字识别发声阅读器及读取文字的方法
CN104599670A (zh) * 2015-01-30 2015-05-06 成都星炫科技有限公司 点读笔的语音识别方法
CN106205599A (zh) * 2016-06-28 2016-12-07 广东欧珀移动通信有限公司 控制方法、控制装置及电子装置
CN107678595A (zh) * 2017-09-30 2018-02-09 上海摩软通讯技术有限公司 盲文识别装置、终端设备和盲文识别方法
CN107678595B (zh) * 2017-09-30 2020-11-03 上海摩软通讯技术有限公司 盲文识别装置、终端设备和盲文识别方法
CN112908111A (zh) * 2021-01-30 2021-06-04 云知声智能科技股份有限公司 一种用于盲人的点读方法、装置及***

Similar Documents

Publication Publication Date Title
CN101009095A (zh) 全自动智能盲用阅读器
CN200997199Y (zh) 一种全自动智能盲用阅读器
US7629989B2 (en) Reducing processing latency in optical character recognition for portable reading machine
US7659915B2 (en) Portable reading device with mode processing
US9236043B2 (en) Document mode processing for portable reading machine enabling document navigation
US8626512B2 (en) Cooperative processing for portable reading machine
US8249309B2 (en) Image evaluation for reading mode in a reading machine
US20150042562A1 (en) Image Resizing For Optical Character Recognition In Portable Reading Machine
US8186581B2 (en) Device and method to assist user in conducting a transaction with a machine
US20060013483A1 (en) Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine
US20060013444A1 (en) Text stitching from multiple images
US20100331043A1 (en) Document and image processing
WO2015059976A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN103077625A (zh) 一种盲用电子阅读器和助盲阅读方法
JP2001283220A (ja) 帳票分類方法及び装置
CN102509479A (zh) 便携式文字识别发声阅读器及读取文字的方法
EP2299387A1 (en) Device and method for recognizing and reading text out loud
KR101946207B1 (ko) 점자 출력 장치
CN101084851A (zh) 便携式电子助视器
CN201055465Y (zh) 一种便携式电子助视器
KR20030055232A (ko) 한자 입력 처리방법 및 장치
CN202067424U (zh) 一种盲人阅读装置
JPH07234919A (ja) 拡大読書器
CN201004322Y (zh) 纸质文字数码摘录存储笔
CN2583906Y (zh) 带有cmos感应器的手机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070801