CN101452705A - 语音文字转换、手语文字转换的方法和装置 - Google Patents

语音文字转换、手语文字转换的方法和装置 Download PDF

Info

Publication number
CN101452705A
CN101452705A CNA2007101719248A CN200710171924A CN101452705A CN 101452705 A CN101452705 A CN 101452705A CN A2007101719248 A CNA2007101719248 A CN A2007101719248A CN 200710171924 A CN200710171924 A CN 200710171924A CN 101452705 A CN101452705 A CN 101452705A
Authority
CN
China
Prior art keywords
sign language
video data
text
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101719248A
Other languages
English (en)
Inventor
周军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Simcom Ltd
Original Assignee
Shanghai Simcom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Simcom Ltd filed Critical Shanghai Simcom Ltd
Priority to CNA2007101719248A priority Critical patent/CN101452705A/zh
Publication of CN101452705A publication Critical patent/CN101452705A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种语音与文字转换的方法,其包括以下步骤:1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种手语与文字转换的方法,其包括以下步骤:1)检测输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种文字可视通讯装置,其包括语音与文字转换终端和手语与文字转换终端。本发明通过可视通讯装置,对声音和图像信号进行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话质量。

Description

语音文字转换、手语文字转换的方法和装置
技术领域
本发明涉及手机、电话等通讯领域,特别是涉及将音频信息或手语视频信息,转换成文字信息并且通过视频进行通讯的方法和装置。
背景技术
目前各种通讯终端不断出现,从固网的座机电话到移动终端比比皆是。但是这些通讯终端都是面向普通人进行使用的功能,对于聋哑人士,目前只有短信这种方式可以进行交流。随着可视通讯时代的到来,人们可以借助网络,进行面对面的交流。但是聋哑人士由于无法用声音进行交流,只能借助手语,另一方面一般人又不懂手语,这就造成了交流上的困难。
发明内容
本发明的目的是提供一种语音文字转换、手语文字转换的方法和装置,使聋哑人士和不懂手语的人能够进行交流,同时也适合普通人群的使用。
本发明的目的是通过以下技术方案实现的:
一种语音与文字转换的方法,其特点在于,其包括以下步骤:1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。
一种手语与文字转换的方法,其特点在于,其包括以下步骤:1)检测输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。
其中,在手语与文字转换的方法中,将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
一种文字可视通讯装置,其特点在于,其包括:语音与文字转换终端,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中;手语与文字转换终端,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
其中,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
本发明的积极进步效果在于:通过可视通讯装置,对声音和图像信号进行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话质量。
附图说明
图1为本发明较佳实施例中,语音与文字转换功能流程图。
图2为本发明较佳实施例中,手语视频与文字转换功能流程图。
图3为图2所示的手语与文字转换过程中,提取文字信息的具体方法流程图。
图4为本发明较佳实施例中,文字可视通讯装置的结构示意图。
图5为本发明较佳实施例中,两人之间通讯的示意图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
一、语音与文字、手语与文字转换的方法和装置
1、语音与文字转换的流程
步骤101,用户选择声音与文字转换操作。
步骤102,检测输入的音频数据。
步骤103,将该音频数据转换成相应的文字信息。
步骤104,编码器将该文字信息编码进入视频数据中。
2、手语与文字转换的流程
步骤201,用户选择手语与文字转换操作。
步骤202,检测输入的手语视频数据。
步骤203,将该手语视频数据转换成相应的文字信息。
步骤204,编码器将该文字信息编码进入视频数据中。
在上述步骤203中,提取文字信息的具体方式如图3所示。
步骤301,摄像机采集手语图像。
步骤302,与预先设置好的手语图像信息对比。
步骤303,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
3、文字可视通讯装置
如图4所示为实现上述方法的一文字可视通讯装置400。该装置包括有如下终端。
语音与文字转换终端401,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中。
手语与文字转换终端402,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
二、实际通讯中的具体操作方法
1、聋哑人士与普通人士通讯
如图5,假定A为聋哑人士,B为普通人士。
1)在A端,A开启文字可视通讯装置400的手语与文字转换功能,A的手语被转换成文字,同时视频编码器将文字信息也编码进入视频数据传送给B。在B终端显示视频图像的同时,将文字信息也显示出来。
2)在B端,B开启文字可视通讯装置400的语音与文字转换功能,将B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A端显示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现聋哑人士和普通人之间的正常交流了。
2、普通人与普通人通讯
如图5,假定A、B均为普通人士。在可视通讯装置的通讯中,考虑到语音在线路上的传输质量不好等问题,也可以将双方的语音转换为文字显示,边听对方的话边看视频上的文字,达到更好的交流效果。
1)在A端,A开启文字可视通讯装置400的语音与文字转换功能,A的语音信号被转换成文字,同时视频编码器将文字信息也编码进入视频数据传送给B。在B终端显示视频图像的同时,将文字信息也显示出来。
2)在B端,B也开启文字可视通讯装置400的语音与文字转换功能,将B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A端显示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现两普通人之间的正常交流了。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改。因此,本发明的保护范围由所附权利要求书限定。

Claims (5)

1、一种语音与文字转换的方法,其特征在于,其包括以下步骤:
1)检测输入的音频数据;
2)将该音频数据转换成相应的文字信息;
3)编码器将该文字信息编码进入视频数据中。
2、一种手语与文字转换的方法,其特征在于,其包括以下步骤:
1)检测输入的手语视频数据;
2)将该手语视频数据转换成相应的文字信息;
3)编码器将该文字信息编码进入视频数据中。
3、根据权利要求2所述的手语与文字转换的方法,其特征在于,其将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
4、一种文字可视通讯装置,其特征在于,其包括:
语音与文字转换终端,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中;
手语与文字转换终端,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
5、根据权利要求4所述的文字可视通讯装置,其特征在于,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
CNA2007101719248A 2007-12-07 2007-12-07 语音文字转换、手语文字转换的方法和装置 Pending CN101452705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007101719248A CN101452705A (zh) 2007-12-07 2007-12-07 语音文字转换、手语文字转换的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007101719248A CN101452705A (zh) 2007-12-07 2007-12-07 语音文字转换、手语文字转换的方法和装置

Publications (1)

Publication Number Publication Date
CN101452705A true CN101452705A (zh) 2009-06-10

Family

ID=40734905

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101719248A Pending CN101452705A (zh) 2007-12-07 2007-12-07 语音文字转换、手语文字转换的方法和装置

Country Status (1)

Country Link
CN (1) CN101452705A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710539A (zh) * 2012-05-02 2012-10-03 中兴通讯股份有限公司 语音信息传送方法及装置
CN103226692A (zh) * 2012-11-22 2013-07-31 广东科学中心 一种视频流图像帧的识别***及其方法
CN104038617A (zh) * 2013-03-04 2014-09-10 联想移动通信科技有限公司 一种进行通话的方法和智能移动终端
CN104135426A (zh) * 2014-07-11 2014-11-05 Tcl通讯(宁波)有限公司 一种利用语音业务传输附件的方法及***
CN104464719A (zh) * 2014-12-16 2015-03-25 上海市共进通信技术有限公司 实现聋哑人智能通讯的***
CN105162944A (zh) * 2015-06-23 2015-12-16 上海斐讯数据通信技术有限公司 一种通话***及方法
CN105450970A (zh) * 2014-06-16 2016-03-30 联想(北京)有限公司 一种信息处理方法及电子设备
CN106943740A (zh) * 2017-04-25 2017-07-14 合肥充盈信息科技有限公司 一种手语语音游戏互动***
CN107707726A (zh) * 2016-08-09 2018-02-16 深圳市鹏华联宇科技通讯有限公司 一种用于正常人与聋哑人通讯的终端和通话方法
CN110740283A (zh) * 2019-10-29 2020-01-31 杭州当虹科技股份有限公司 一种基于视频通讯的语音转文字方法
CN110995921A (zh) * 2019-11-19 2020-04-10 维沃移动通信有限公司 通话处理方法、电子设备及计算机可读存储介质
CN115066907A (zh) * 2019-12-09 2022-09-16 金京喆 用户终端、广播装置、包括该装置的广播***及其控制方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710539A (zh) * 2012-05-02 2012-10-03 中兴通讯股份有限公司 语音信息传送方法及装置
CN103226692A (zh) * 2012-11-22 2013-07-31 广东科学中心 一种视频流图像帧的识别***及其方法
CN104038617A (zh) * 2013-03-04 2014-09-10 联想移动通信科技有限公司 一种进行通话的方法和智能移动终端
CN105450970A (zh) * 2014-06-16 2016-03-30 联想(北京)有限公司 一种信息处理方法及电子设备
CN105450970B (zh) * 2014-06-16 2019-03-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN104135426A (zh) * 2014-07-11 2014-11-05 Tcl通讯(宁波)有限公司 一种利用语音业务传输附件的方法及***
CN104464719A (zh) * 2014-12-16 2015-03-25 上海市共进通信技术有限公司 实现聋哑人智能通讯的***
CN105162944A (zh) * 2015-06-23 2015-12-16 上海斐讯数据通信技术有限公司 一种通话***及方法
CN105162944B (zh) * 2015-06-23 2018-04-06 上海斐讯数据通信技术有限公司 一种通话***及方法
CN107707726A (zh) * 2016-08-09 2018-02-16 深圳市鹏华联宇科技通讯有限公司 一种用于正常人与聋哑人通讯的终端和通话方法
CN106943740A (zh) * 2017-04-25 2017-07-14 合肥充盈信息科技有限公司 一种手语语音游戏互动***
CN110740283A (zh) * 2019-10-29 2020-01-31 杭州当虹科技股份有限公司 一种基于视频通讯的语音转文字方法
CN110995921A (zh) * 2019-11-19 2020-04-10 维沃移动通信有限公司 通话处理方法、电子设备及计算机可读存储介质
CN115066907A (zh) * 2019-12-09 2022-09-16 金京喆 用户终端、广播装置、包括该装置的广播***及其控制方法

Similar Documents

Publication Publication Date Title
CN101452705A (zh) 语音文字转换、手语文字转换的方法和装置
US9111545B2 (en) Hand-held communication aid for individuals with auditory, speech and visual impairments
CN101340676B (zh) 一种实现同声翻译的方法、装置和移动终端
CN101510256B (zh) 一种口型语言的转换方法及装置
WO2001059976A3 (en) System and method for internet call management with text-to-speech messaging
CN101123630A (zh) 语音和文字转换的通话方法与***
CN101175264A (zh) 一种可视通信的装置
CN101931779A (zh) 一种可视电话及其通讯方法
CN101453611A (zh) 失聪者与正常人的视频通讯方法
CN103997571A (zh) 基于音频编码的名片交换方法
CN101453499A (zh) 一种手机音字转换装置及其方法
KR20110051385A (ko) 통신 단말기 및 그의 통신 방법
EP1855441A3 (en) Multimedia data monitoring method
CN100563334C (zh) 在无线终端的视频电话模式中发送图像数据的方法
KR20150025750A (ko) 사용자 단말 장치 및 그 양방향 번역 방법
CN101420585A (zh) 由可视电话终端传输非视频信息的***和方法
KR20010107877A (ko) 음성인식을 통한 쓰리디 애니메이션 수화표현 시스템
KR20140006198A (ko) 무선캡션대화 서비스 시스템
JP2932027B2 (ja) テレビ電話装置
JP2000004304A (ja) 異なる手段での会話が可能な通話装置
CN101193150A (zh) 以声音播出来电者的姓名供使用者辨识的方法
KR101334015B1 (ko) 다자간 화상 통화시 화자 구분 기능을 구비한 휴대용단말기 및 다자간 화상 통화시 화자 구분 방법
CN204733229U (zh) 一种通过生物特征识别技术显示主叫个人信息的通信装置
CN107562738A (zh) 一种基于用户需求的手语翻译方法
AU2020103854A4 (en) Method and system for assisting communication for deaf persons

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20090610