CN101452705A - 语音文字转换、手语文字转换的方法和装置 - Google Patents
语音文字转换、手语文字转换的方法和装置 Download PDFInfo
- Publication number
- CN101452705A CN101452705A CNA2007101719248A CN200710171924A CN101452705A CN 101452705 A CN101452705 A CN 101452705A CN A2007101719248 A CNA2007101719248 A CN A2007101719248A CN 200710171924 A CN200710171924 A CN 200710171924A CN 101452705 A CN101452705 A CN 101452705A
- Authority
- CN
- China
- Prior art keywords
- sign language
- video data
- text
- image
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种语音与文字转换的方法,其包括以下步骤:1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种手语与文字转换的方法,其包括以下步骤:1)检测输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种文字可视通讯装置,其包括语音与文字转换终端和手语与文字转换终端。本发明通过可视通讯装置,对声音和图像信号进行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话质量。
Description
技术领域
本发明涉及手机、电话等通讯领域,特别是涉及将音频信息或手语视频信息,转换成文字信息并且通过视频进行通讯的方法和装置。
背景技术
目前各种通讯终端不断出现,从固网的座机电话到移动终端比比皆是。但是这些通讯终端都是面向普通人进行使用的功能,对于聋哑人士,目前只有短信这种方式可以进行交流。随着可视通讯时代的到来,人们可以借助网络,进行面对面的交流。但是聋哑人士由于无法用声音进行交流,只能借助手语,另一方面一般人又不懂手语,这就造成了交流上的困难。
发明内容
本发明的目的是提供一种语音文字转换、手语文字转换的方法和装置,使聋哑人士和不懂手语的人能够进行交流,同时也适合普通人群的使用。
本发明的目的是通过以下技术方案实现的:
一种语音与文字转换的方法,其特点在于,其包括以下步骤:1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。
一种手语与文字转换的方法,其特点在于,其包括以下步骤:1)检测输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。
其中,在手语与文字转换的方法中,将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
一种文字可视通讯装置,其特点在于,其包括:语音与文字转换终端,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中;手语与文字转换终端,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
其中,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
本发明的积极进步效果在于:通过可视通讯装置,对声音和图像信号进行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话质量。
附图说明
图1为本发明较佳实施例中,语音与文字转换功能流程图。
图2为本发明较佳实施例中,手语视频与文字转换功能流程图。
图3为图2所示的手语与文字转换过程中,提取文字信息的具体方法流程图。
图4为本发明较佳实施例中,文字可视通讯装置的结构示意图。
图5为本发明较佳实施例中,两人之间通讯的示意图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
一、语音与文字、手语与文字转换的方法和装置
1、语音与文字转换的流程
步骤101,用户选择声音与文字转换操作。
步骤102,检测输入的音频数据。
步骤103,将该音频数据转换成相应的文字信息。
步骤104,编码器将该文字信息编码进入视频数据中。
2、手语与文字转换的流程
步骤201,用户选择手语与文字转换操作。
步骤202,检测输入的手语视频数据。
步骤203,将该手语视频数据转换成相应的文字信息。
步骤204,编码器将该文字信息编码进入视频数据中。
在上述步骤203中,提取文字信息的具体方式如图3所示。
步骤301,摄像机采集手语图像。
步骤302,与预先设置好的手语图像信息对比。
步骤303,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
3、文字可视通讯装置
如图4所示为实现上述方法的一文字可视通讯装置400。该装置包括有如下终端。
语音与文字转换终端401,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中。
手语与文字转换终端402,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
二、实际通讯中的具体操作方法
1、聋哑人士与普通人士通讯
如图5,假定A为聋哑人士,B为普通人士。
1)在A端,A开启文字可视通讯装置400的手语与文字转换功能,A的手语被转换成文字,同时视频编码器将文字信息也编码进入视频数据传送给B。在B终端显示视频图像的同时,将文字信息也显示出来。
2)在B端,B开启文字可视通讯装置400的语音与文字转换功能,将B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A端显示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现聋哑人士和普通人之间的正常交流了。
2、普通人与普通人通讯
如图5,假定A、B均为普通人士。在可视通讯装置的通讯中,考虑到语音在线路上的传输质量不好等问题,也可以将双方的语音转换为文字显示,边听对方的话边看视频上的文字,达到更好的交流效果。
1)在A端,A开启文字可视通讯装置400的语音与文字转换功能,A的语音信号被转换成文字,同时视频编码器将文字信息也编码进入视频数据传送给B。在B终端显示视频图像的同时,将文字信息也显示出来。
2)在B端,B也开启文字可视通讯装置400的语音与文字转换功能,将B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A端显示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现两普通人之间的正常交流了。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改。因此,本发明的保护范围由所附权利要求书限定。
Claims (5)
1、一种语音与文字转换的方法,其特征在于,其包括以下步骤:
1)检测输入的音频数据;
2)将该音频数据转换成相应的文字信息;
3)编码器将该文字信息编码进入视频数据中。
2、一种手语与文字转换的方法,其特征在于,其包括以下步骤:
1)检测输入的手语视频数据;
2)将该手语视频数据转换成相应的文字信息;
3)编码器将该文字信息编码进入视频数据中。
3、根据权利要求2所述的手语与文字转换的方法,其特征在于,其将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
4、一种文字可视通讯装置,其特征在于,其包括:
语音与文字转换终端,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中;
手语与文字转换终端,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
5、根据权利要求4所述的文字可视通讯装置,其特征在于,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101719248A CN101452705A (zh) | 2007-12-07 | 2007-12-07 | 语音文字转换、手语文字转换的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101719248A CN101452705A (zh) | 2007-12-07 | 2007-12-07 | 语音文字转换、手语文字转换的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101452705A true CN101452705A (zh) | 2009-06-10 |
Family
ID=40734905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101719248A Pending CN101452705A (zh) | 2007-12-07 | 2007-12-07 | 语音文字转换、手语文字转换的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101452705A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102710539A (zh) * | 2012-05-02 | 2012-10-03 | 中兴通讯股份有限公司 | 语音信息传送方法及装置 |
CN103226692A (zh) * | 2012-11-22 | 2013-07-31 | 广东科学中心 | 一种视频流图像帧的识别***及其方法 |
CN104038617A (zh) * | 2013-03-04 | 2014-09-10 | 联想移动通信科技有限公司 | 一种进行通话的方法和智能移动终端 |
CN104135426A (zh) * | 2014-07-11 | 2014-11-05 | Tcl通讯(宁波)有限公司 | 一种利用语音业务传输附件的方法及*** |
CN104464719A (zh) * | 2014-12-16 | 2015-03-25 | 上海市共进通信技术有限公司 | 实现聋哑人智能通讯的*** |
CN105162944A (zh) * | 2015-06-23 | 2015-12-16 | 上海斐讯数据通信技术有限公司 | 一种通话***及方法 |
CN105450970A (zh) * | 2014-06-16 | 2016-03-30 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106943740A (zh) * | 2017-04-25 | 2017-07-14 | 合肥充盈信息科技有限公司 | 一种手语语音游戏互动*** |
CN107707726A (zh) * | 2016-08-09 | 2018-02-16 | 深圳市鹏华联宇科技通讯有限公司 | 一种用于正常人与聋哑人通讯的终端和通话方法 |
CN110740283A (zh) * | 2019-10-29 | 2020-01-31 | 杭州当虹科技股份有限公司 | 一种基于视频通讯的语音转文字方法 |
CN110995921A (zh) * | 2019-11-19 | 2020-04-10 | 维沃移动通信有限公司 | 通话处理方法、电子设备及计算机可读存储介质 |
CN115066907A (zh) * | 2019-12-09 | 2022-09-16 | 金京喆 | 用户终端、广播装置、包括该装置的广播***及其控制方法 |
-
2007
- 2007-12-07 CN CNA2007101719248A patent/CN101452705A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102710539A (zh) * | 2012-05-02 | 2012-10-03 | 中兴通讯股份有限公司 | 语音信息传送方法及装置 |
CN103226692A (zh) * | 2012-11-22 | 2013-07-31 | 广东科学中心 | 一种视频流图像帧的识别***及其方法 |
CN104038617A (zh) * | 2013-03-04 | 2014-09-10 | 联想移动通信科技有限公司 | 一种进行通话的方法和智能移动终端 |
CN105450970A (zh) * | 2014-06-16 | 2016-03-30 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN105450970B (zh) * | 2014-06-16 | 2019-03-29 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104135426A (zh) * | 2014-07-11 | 2014-11-05 | Tcl通讯(宁波)有限公司 | 一种利用语音业务传输附件的方法及*** |
CN104464719A (zh) * | 2014-12-16 | 2015-03-25 | 上海市共进通信技术有限公司 | 实现聋哑人智能通讯的*** |
CN105162944A (zh) * | 2015-06-23 | 2015-12-16 | 上海斐讯数据通信技术有限公司 | 一种通话***及方法 |
CN105162944B (zh) * | 2015-06-23 | 2018-04-06 | 上海斐讯数据通信技术有限公司 | 一种通话***及方法 |
CN107707726A (zh) * | 2016-08-09 | 2018-02-16 | 深圳市鹏华联宇科技通讯有限公司 | 一种用于正常人与聋哑人通讯的终端和通话方法 |
CN106943740A (zh) * | 2017-04-25 | 2017-07-14 | 合肥充盈信息科技有限公司 | 一种手语语音游戏互动*** |
CN110740283A (zh) * | 2019-10-29 | 2020-01-31 | 杭州当虹科技股份有限公司 | 一种基于视频通讯的语音转文字方法 |
CN110995921A (zh) * | 2019-11-19 | 2020-04-10 | 维沃移动通信有限公司 | 通话处理方法、电子设备及计算机可读存储介质 |
CN115066907A (zh) * | 2019-12-09 | 2022-09-16 | 金京喆 | 用户终端、广播装置、包括该装置的广播***及其控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101452705A (zh) | 语音文字转换、手语文字转换的方法和装置 | |
US9111545B2 (en) | Hand-held communication aid for individuals with auditory, speech and visual impairments | |
CN101340676B (zh) | 一种实现同声翻译的方法、装置和移动终端 | |
CN101510256B (zh) | 一种口型语言的转换方法及装置 | |
WO2001059976A3 (en) | System and method for internet call management with text-to-speech messaging | |
CN101123630A (zh) | 语音和文字转换的通话方法与*** | |
CN101175264A (zh) | 一种可视通信的装置 | |
CN101931779A (zh) | 一种可视电话及其通讯方法 | |
CN101453611A (zh) | 失聪者与正常人的视频通讯方法 | |
CN103997571A (zh) | 基于音频编码的名片交换方法 | |
CN101453499A (zh) | 一种手机音字转换装置及其方法 | |
KR20110051385A (ko) | 통신 단말기 및 그의 통신 방법 | |
EP1855441A3 (en) | Multimedia data monitoring method | |
CN100563334C (zh) | 在无线终端的视频电话模式中发送图像数据的方法 | |
KR20150025750A (ko) | 사용자 단말 장치 및 그 양방향 번역 방법 | |
CN101420585A (zh) | 由可视电话终端传输非视频信息的***和方法 | |
KR20010107877A (ko) | 음성인식을 통한 쓰리디 애니메이션 수화표현 시스템 | |
KR20140006198A (ko) | 무선캡션대화 서비스 시스템 | |
JP2932027B2 (ja) | テレビ電話装置 | |
JP2000004304A (ja) | 異なる手段での会話が可能な通話装置 | |
CN101193150A (zh) | 以声音播出来电者的姓名供使用者辨识的方法 | |
KR101334015B1 (ko) | 다자간 화상 통화시 화자 구분 기능을 구비한 휴대용단말기 및 다자간 화상 통화시 화자 구분 방법 | |
CN204733229U (zh) | 一种通过生物特征识别技术显示主叫个人信息的通信装置 | |
CN107562738A (zh) | 一种基于用户需求的手语翻译方法 | |
AU2020103854A4 (en) | Method and system for assisting communication for deaf persons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20090610 |