CN1556496A

CN1556496A - 唇形识别发声器

Info

Publication number: CN1556496A
Application number: CNA2003101220227A
Authority: CN
Inventors: 刚李; 李刚; 解国明; 林凌; 任惠茹
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2003-12-31
Filing date: 2003-12-31
Publication date: 2004-12-22

Abstract

本发明公开一种唇形识别发声器，它的连接方式是：***头1与图像采集单元2相连接，图像采集单元2的输出接唇型图像模式识别单元3，唇型图像模式识别单元3的信号输出到语音合成单元4，语音合成单元4与语音存储单元5相连接，语音合成单元4从语音存储单元5提取语音合成要素合成声音信号，输出到发声单元6，而后通过扬声器7发出与唇型及其变化顺序相对应的声音。本发明通过识别说话者的唇形，确定说话内容，语音合成说话内容，实时通过扬声器发出声音。本发明可以帮助因为喉或者声带切除不能发声的人或者会唇语的聋哑人发出声音，方便了他们和正常人交流。

Description

唇形识别发声器

技术领域

本发明涉及一种发声器，特别涉及一种唇形识别发声器。

背景技术

临床上，许多病人因为喉或者声带病变进行了喉或者声带切除手术，术后不能发声从而阻碍了他们与正常人进行交流。聋哑人一般和正常人进行交流是通过读正常人的唇语来确定对方说话内容的。聋哑人却很难让别人明白自己的意思。利用唇形图像识别和语音合成发声仪器，它可以帮助不能发声的人发出声音，去除他们和正常人交流障碍。但是目前尚未有一种仪器和技术方案可以帮助上述病人和聋哑人发出声音，方便他们和正常人交流。

发明内容

本发明的目的，在于提供一种发声仪器可以帮助上述病人和聋哑人发声，方便和正常人进行交流。本发明是通过辨识说话者的唇形，通过模式识别确定其说话内容，然后通过语音合成技术发出声音。语言的绝大多数音，在说话时都有确定的唇形。本发明能够把说话者的唇形和想发声的“音”一一对应，采用语音合成技术通过扬声器发出声音。

本发明是通过下述技术方案加以实现的：

1.通过摄像头和图像采集单元采集说话者唇形图像。

2.对唇形图像进行图像处理，实时、动态提取唇形特征，然后用唇形模式识别算法确定说话内容。

3.根据模式识别结果，语音合成单元从语音存储单元提取语音，合成说话内容并通过发声单元送出。

本发明如图1所示：***头1与图像采集单元2相连接，图像采集单元2的输出接唇型图像模式识别单元3，唇型图像模式识别单元3的信号输出到语音合成单元4，语音合成单元4与语音存储单元5相连接，语音合成单元4从语音存储单元5提取语音合成要素合成声音信号，输出到发声单元6，而后通过扬声器7发出与唇型及其变化顺序相对应的声音。

可以将唇形图像处理和模式识别单元，语音合成单元，语音存储单元用处理器8来实现，处理器可以是数字信号处理器(DSP)或其他微处理器(如ARM)等。

而***头1与图像采集单元可以是集成在一起的具有数字信号输出的摄像头，如CCD摄像头和其他图象传感器。

发声单元6可以采用数字/模拟转换器和放大器组成，也可以采用多媒体数字信号编解码器。

本发明通过识别说话者的唇形，确定说话内容，语音合成说话内容，实时通过扬声器发出声音。本发明可以帮助因为喉或者声带切除不能发声的人或者会唇语的聋哑人发出声音，方便了他们和正常人交流。

附图说明

图1为本发明的***连接框图。

图2本发明的一种唇形识别发声器。

具体实施方式

下面结合附图对本发明作详细说明：

如图1所示的连接方法，***头1与图像采集单元2相连接，图像采集单元2的输出接唇型图像模式识别单元3，唇型图像模式识别单元3的信号输出到语音合成单元4，语音合成单元4与语音存储单元5相连接，语音合成单元4从语音存储单元5提取语音合成要素合成声音信号，输出到发声单元6，而后通过扬声器7发出与唇型及其变化顺序相对应的声音。

采用***头1，减小体积，***头放于唇前，只摄取唇形图像，不摄取面部其它图像，它的输出接图像采集单元。图像采集单元2采用视频采集芯片，输入接***头的输出，输出和图像处理和模式识别单元3连接。图像处理和模式识别单元是仪器的核心，采用数字信号处理器(DSP)或其他微处理器(如ARM)，主要进行唇形图像的预处理、特征提取和模式识别。语音合成单元4根据唇形模式识别的结果合成语音。它也由数字信号处理器完成。语音存储单元5为一个数据库，存储所有基本音素，采用大容量存储器存储。发声单元6由数模转换器和放大器组成。数模转换器把数字音频信号转换成模拟音频信号，经放大器放大后驱动扬声器7。发声单元也可以采用多媒体数字信号编解码器。扬声器送出声音。

本实施例的***头和图像采集单元可以采用集成一体化图象传感器。

本实施例的唇形图像处理和模式识别单元，语音合成单元，语音存储单元采用的处理器8可以是数字信号微处理器或数字信号微处理器***，也可以采用微处理器或微处理器***，或者采用采用ARM微处理器或ARM微处理器***。

本实施例的发声单元包括数模转换器和放大器组成。

为方便适用，本发明外观为耳机形状。***头放于普通耳机放麦克风的位置，扬声器通过连线接出，仪器其它功能单元电路放置耳朵部位。如附图2所示。

使用者像带耳机一样带上本装置，将***头拉下，对准自己的唇部，打开开关，开始说话。尽管使用者发不出声音，只要唇部像正常说话时的动作一样，本装置就可以发出正确声音。对于有些使用者说话时唇形不标准，需经过一定训练。经过训练的使用者，本仪器可以满足日常交流。

Claims

1.一种唇形识别发声器，它由六部分构成：***头，图像采集单元，唇形图像处理和模式识别单元，语音合成单元，语音存储单元和发声单元；其特征是***头(1)与图像采集单元(2)相连接，图像采集单元(2)的输出接唇型图像模式识别单元(3)，唇型图像模式识别单元(3)的信号输出到语音合成单元(4)，语音合成单元(4)与语音存储单元(5)相连接，语音合成单元(4)从语音存储单元(5)提取语音合成要素合成声音信号，输出到发声单元(6)，而后通过扬声器(7)发出与唇型及其变化顺序相对应的声音。

2.按权利要求1所说的唇形识别发声器，其特征在于：***头和图像采集单元采用集成一体化图像传感器。

3.按权利要求1所说的唇形识别发声器，其特征在于：唇形图像处理和模式识别单元，语音合成单元，语音存储单元采用数字信号微处理器或数字信号微处理器***。

4.按权利要求1所说的唇形识别发声器，其特征在于：唇形图像处理和模式识别单元，语音合成单元，语音存储单元采用微处理器或微处理器***。

5.按权利要求1所说的唇形识别发声器，其特征在于：唇形图像处理和模式识别单元，语音合成单元，语音存储单元采用ARM微处理器或ARM微处理器***。

6.按权利要求1所说的唇形识别发声器，其特征在于：发声单元包括数模转换器和放大器组成。

7.按权利要求1所说的唇形识别发声器，其特征在于：发声单元采用多媒体数字信号编解码器。

8.按权利要求1所说的唇形识别发声器，其特征在于：***头设置在嘴唇前方。