CN105761721A - 一种携带位置信息的语音编码方法 - Google Patents
一种携带位置信息的语音编码方法 Download PDFInfo
- Publication number
- CN105761721A CN105761721A CN201610148864.7A CN201610148864A CN105761721A CN 105761721 A CN105761721 A CN 105761721A CN 201610148864 A CN201610148864 A CN 201610148864A CN 105761721 A CN105761721 A CN 105761721A
- Authority
- CN
- China
- Prior art keywords
- voice
- position information
- information
- positional information
- sound card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000001172 regenerating effect Effects 0.000 claims abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/222—Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法;其包括信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。
Description
技术领域
本发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法。
背景技术
目前声音数据格式中一般仅含音频信息,并没有单独将发声源方位信息进行编码。能够让人有方位感的音频格式为5.1或7.1音轨的音频文件。然而5.1或7.1的音频文件,需要支持多声道的声卡及多个音箱方能让人感受到声音的方位。目前虚拟5.1、虚拟7.1处理,都是需要原声音数数含5.1音源或7.1音源,否则无法重现声音的环绕效果。
发明内容
本发明针对现有技术的问题提供一种携带位置信息的语音编码方法,在音频格式中携带有声源方位信息,实现在语音信息中携带位置信息。
为了解决上述技术问题,本发明采用如下技术方案:
一种携带位置信息的语音编码方法,包括:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;
(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;
(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。
其中,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。
本发明的有益效果:
本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。以下对本发明进行详细的描述。
在日常生活中某些情况下,例如电影或游戏的音频中,往往需要将一些声音播放出来,使得人感觉是在某个方向发出来的。如:某电影中需要从右前方45度方向、距离3m处,发出狗叫声,那么我们可以将采集到的狗叫声,再加上此位置信息(右前方45度,3m远),进行统一编码。本发明所提供的一种携带位置信息的语音编码方法,具体包括以下步骤:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;(3)、编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明通过上述信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。
在语音的编码格式中,含有位置信息字段的含义及数学模型如下:位置信息是音源的一个位置信息,是在某一坐标系内的一个坐标值。以听音者两耳中心位置为原点,可以在二维或三维空间内,进行定位,在其二维或三维的坐标系中,可以获取发音源位置的坐标数值。位置信息在二维空间内采用角度与距离值或者采用正交坐标系,在三维空间内采用三维笛卡尔坐标系。转码步骤中的位置信息无论是二维位置信息还是三维的位置信息,如(x,y)、(r,θ)、或(x,y,z)、(x,α,β)等,均可通过位置编码器将其转换为固定长度的二进制码。
在本发明中,为了使得位置信息与语音信息实现统一编码,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号通过码速调整器进行码速调整。然后,再确定声音与位置信息的一个对应方式,可以有两种不同处理方式:1)以固定时长T的语音信息匹配位置信息,T将会在编码的头部信息中进行说明,以适应不同场景的设计需求;2)以固定位宽L的语音信息匹配位置信息,L将会在编码的头部信息中进行说明,以适应不同场景的设计需求。
码速调整器将语音信息按照固定T时长或者固定位宽L的处理方式进行码速调整,然后找到二进制位置信息在语音数据流中***的位置,语音合成器将位置信息***语音数字信息中,实现统一编码。
以上所述,仅是本发明较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明以较佳实施例公开如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当利用上述揭示的技术内容作出些许变更或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明技术是指对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。
Claims (2)
1.一种携带位置信息的语音编码方法,其特征在于包括:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;
(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;
(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。
2.根据权利要求1所述的一种携带位置信息的语音编码方法,其特征在于:进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610148864.7A CN105761721A (zh) | 2016-03-16 | 2016-03-16 | 一种携带位置信息的语音编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610148864.7A CN105761721A (zh) | 2016-03-16 | 2016-03-16 | 一种携带位置信息的语音编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105761721A true CN105761721A (zh) | 2016-07-13 |
Family
ID=56333288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610148864.7A Pending CN105761721A (zh) | 2016-03-16 | 2016-03-16 | 一种携带位置信息的语音编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105761721A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018121524A1 (zh) * | 2016-12-30 | 2018-07-05 | 中兴通讯股份有限公司 | 一种数据处理方法及装置、采集设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350931A (zh) * | 2008-08-27 | 2009-01-21 | 深圳华为通信技术有限公司 | 音频信号的生成、播放方法及装置、处理*** |
CN102480671A (zh) * | 2010-11-26 | 2012-05-30 | 华为终端有限公司 | 视频通信中的音频处理方法和装置 |
US20130101122A1 (en) * | 2008-12-02 | 2013-04-25 | Electronics And Telecommunications Research Institute | Apparatus for generating and playing object based audio contents |
CN105263093A (zh) * | 2015-10-12 | 2016-01-20 | 深圳东方酷音信息技术有限公司 | 一种全方位声音采集装置、编辑装置及*** |
-
2016
- 2016-03-16 CN CN201610148864.7A patent/CN105761721A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350931A (zh) * | 2008-08-27 | 2009-01-21 | 深圳华为通信技术有限公司 | 音频信号的生成、播放方法及装置、处理*** |
US20130101122A1 (en) * | 2008-12-02 | 2013-04-25 | Electronics And Telecommunications Research Institute | Apparatus for generating and playing object based audio contents |
CN102480671A (zh) * | 2010-11-26 | 2012-05-30 | 华为终端有限公司 | 视频通信中的音频处理方法和装置 |
CN105263093A (zh) * | 2015-10-12 | 2016-01-20 | 深圳东方酷音信息技术有限公司 | 一种全方位声音采集装置、编辑装置及*** |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018121524A1 (zh) * | 2016-12-30 | 2018-07-05 | 中兴通讯股份有限公司 | 一种数据处理方法及装置、采集设备及存储介质 |
US10911884B2 (en) | 2016-12-30 | 2021-02-02 | Zte Corporation | Data processing method and apparatus, acquisition device, and storage medium |
US11223923B2 (en) | 2016-12-30 | 2022-01-11 | Zte Corporation | Data processing method and apparatus, acquisition device, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
IL271502A (en) | Adaptive processing with multiple media processor nodes | |
ZA202105927B (en) | Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs | |
CN105009207B (zh) | 处理信道信号的编码/解码装置及方法 | |
CN111885414A (zh) | 一种数据处理方法、装置、设备及可读存储介质 | |
CN105229734B (zh) | 编码装置和方法、解码装置和方法以及计算机可读介质 | |
GB2416610A (en) | Reversible document format | |
CN106463121A (zh) | 较高阶立体混响信号压缩 | |
CN103299366A (zh) | 用于编码及检测带水印信号的装置 | |
MY184847A (en) | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework | |
DE69233236D1 (de) | Ton- und Bild-Daten Verteilungsverfahren | |
CN101632118A (zh) | 包括信息比特流转换的用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法 | |
JP2009520382A5 (zh) | ||
JPWO2019198540A1 (ja) | 情報処理装置および方法、並びにプログラム | |
CN106448686B (zh) | 一种自适应音频空域隐写方法 | |
CN105247893A (zh) | 音频信号输出装置和方法、编码装置和方法、解码装置和方法及程序 | |
AU2003298146A1 (en) | Method for describing the composition of audio signals | |
ATE205041T1 (de) | Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals | |
CN105898669B (zh) | 一种声音对象的编码方法 | |
WO2022079049A3 (en) | Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects | |
CN105761721A (zh) | 一种携带位置信息的语音编码方法 | |
CN113571048A (zh) | 一种音频数据检测方法、装置、设备及可读存储介质 | |
CN102647617B (zh) | 一种前端装置及在前端实现视频指纹预处理的方法 | |
TW200501055A (en) | Class quantization for distributed speech recognition | |
CN109801639B (zh) | 一种符合ac-3格式的全景声信号的编解码方法 | |
MX2021001377A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo de codificacion de datos tridimensionales y dispositivo de decodificacion de datos tridimensionales. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Industrial Road, Songshan Lake high tech Industrial Development Zone, Guangdong city of Dongguan province No. 6 523808 1 5 floor Applicant after: Jiahe intelligent Polytron Technologies Inc Address before: Industrial Road, Songshan Lake high tech Industrial Development Zone, Guangdong city of Dongguan province No. 6 523808 1 5 floor Applicant before: COSONIC ACOUSTIC TECHNOLOGY CO., LTD. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160713 |
|
RJ01 | Rejection of invention patent application after publication |