CN105761721A - 一种携带位置信息的语音编码方法 - Google Patents

一种携带位置信息的语音编码方法 Download PDF

Info

Publication number
CN105761721A
CN105761721A CN201610148864.7A CN201610148864A CN105761721A CN 105761721 A CN105761721 A CN 105761721A CN 201610148864 A CN201610148864 A CN 201610148864A CN 105761721 A CN105761721 A CN 105761721A
Authority
CN
China
Prior art keywords
voice
position information
information
positional information
sound card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610148864.7A
Other languages
English (en)
Inventor
邓星球
胡中骥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
COSONIC ACOUSTIC TECHNOLOGY Co Ltd
Original Assignee
COSONIC ACOUSTIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by COSONIC ACOUSTIC TECHNOLOGY Co Ltd filed Critical COSONIC ACOUSTIC TECHNOLOGY Co Ltd
Priority to CN201610148864.7A priority Critical patent/CN105761721A/zh
Publication of CN105761721A publication Critical patent/CN105761721A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/222Monitoring or handling of messages using geographical location information, e.g. messages transmitted or received in proximity of a certain spot or area

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法;其包括信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。

Description

一种携带位置信息的语音编码方法
技术领域
本发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法。
背景技术
目前声音数据格式中一般仅含音频信息,并没有单独将发声源方位信息进行编码。能够让人有方位感的音频格式为5.1或7.1音轨的音频文件。然而5.1或7.1的音频文件,需要支持多声道的声卡及多个音箱方能让人感受到声音的方位。目前虚拟5.1、虚拟7.1处理,都是需要原声音数数含5.1音源或7.1音源,否则无法重现声音的环绕效果。
发明内容
本发明针对现有技术的问题提供一种携带位置信息的语音编码方法,在音频格式中携带有声源方位信息,实现在语音信息中携带位置信息。
为了解决上述技术问题,本发明采用如下技术方案:
一种携带位置信息的语音编码方法,包括:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;
(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;
(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。
其中,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。
本发明的有益效果:
本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。以下对本发明进行详细的描述。
在日常生活中某些情况下,例如电影或游戏的音频中,往往需要将一些声音播放出来,使得人感觉是在某个方向发出来的。如:某电影中需要从右前方45度方向、距离3m处,发出狗叫声,那么我们可以将采集到的狗叫声,再加上此位置信息(右前方45度,3m远),进行统一编码。本发明所提供的一种携带位置信息的语音编码方法,具体包括以下步骤:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;(3)、编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明通过上述信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。
在语音的编码格式中,含有位置信息字段的含义及数学模型如下:位置信息是音源的一个位置信息,是在某一坐标系内的一个坐标值。以听音者两耳中心位置为原点,可以在二维或三维空间内,进行定位,在其二维或三维的坐标系中,可以获取发音源位置的坐标数值。位置信息在二维空间内采用角度与距离值或者采用正交坐标系,在三维空间内采用三维笛卡尔坐标系。转码步骤中的位置信息无论是二维位置信息还是三维的位置信息,如(x,y)、(r,θ)、或(x,y,z)、(x,α,β)等,均可通过位置编码器将其转换为固定长度的二进制码。
在本发明中,为了使得位置信息与语音信息实现统一编码,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号通过码速调整器进行码速调整。然后,再确定声音与位置信息的一个对应方式,可以有两种不同处理方式:1)以固定时长T的语音信息匹配位置信息,T将会在编码的头部信息中进行说明,以适应不同场景的设计需求;2)以固定位宽L的语音信息匹配位置信息,L将会在编码的头部信息中进行说明,以适应不同场景的设计需求。
码速调整器将语音信息按照固定T时长或者固定位宽L的处理方式进行码速调整,然后找到二进制位置信息在语音数据流中***的位置,语音合成器将位置信息***语音数字信息中,实现统一编码。
以上所述,仅是本发明较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明以较佳实施例公开如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当利用上述揭示的技术内容作出些许变更或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明技术是指对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。

Claims (2)

1.一种携带位置信息的语音编码方法,其特征在于包括:
(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;
(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;
(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。
2.根据权利要求1所述的一种携带位置信息的语音编码方法,其特征在于:进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。
CN201610148864.7A 2016-03-16 2016-03-16 一种携带位置信息的语音编码方法 Pending CN105761721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610148864.7A CN105761721A (zh) 2016-03-16 2016-03-16 一种携带位置信息的语音编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610148864.7A CN105761721A (zh) 2016-03-16 2016-03-16 一种携带位置信息的语音编码方法

Publications (1)

Publication Number Publication Date
CN105761721A true CN105761721A (zh) 2016-07-13

Family

ID=56333288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610148864.7A Pending CN105761721A (zh) 2016-03-16 2016-03-16 一种携带位置信息的语音编码方法

Country Status (1)

Country Link
CN (1) CN105761721A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121524A1 (zh) * 2016-12-30 2018-07-05 中兴通讯股份有限公司 一种数据处理方法及装置、采集设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350931A (zh) * 2008-08-27 2009-01-21 深圳华为通信技术有限公司 音频信号的生成、播放方法及装置、处理***
CN102480671A (zh) * 2010-11-26 2012-05-30 华为终端有限公司 视频通信中的音频处理方法和装置
US20130101122A1 (en) * 2008-12-02 2013-04-25 Electronics And Telecommunications Research Institute Apparatus for generating and playing object based audio contents
CN105263093A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种全方位声音采集装置、编辑装置及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350931A (zh) * 2008-08-27 2009-01-21 深圳华为通信技术有限公司 音频信号的生成、播放方法及装置、处理***
US20130101122A1 (en) * 2008-12-02 2013-04-25 Electronics And Telecommunications Research Institute Apparatus for generating and playing object based audio contents
CN102480671A (zh) * 2010-11-26 2012-05-30 华为终端有限公司 视频通信中的音频处理方法和装置
CN105263093A (zh) * 2015-10-12 2016-01-20 深圳东方酷音信息技术有限公司 一种全方位声音采集装置、编辑装置及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121524A1 (zh) * 2016-12-30 2018-07-05 中兴通讯股份有限公司 一种数据处理方法及装置、采集设备及存储介质
US10911884B2 (en) 2016-12-30 2021-02-02 Zte Corporation Data processing method and apparatus, acquisition device, and storage medium
US11223923B2 (en) 2016-12-30 2022-01-11 Zte Corporation Data processing method and apparatus, acquisition device, and storage medium

Similar Documents

Publication Publication Date Title
IL271502A (en) Adaptive processing with multiple media processor nodes
ZA202105927B (en) Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs
CN105009207B (zh) 处理信道信号的编码/解码装置及方法
CN111885414A (zh) 一种数据处理方法、装置、设备及可读存储介质
CN105229734B (zh) 编码装置和方法、解码装置和方法以及计算机可读介质
GB2416610A (en) Reversible document format
CN106463121A (zh) 较高阶立体混响信号压缩
CN103299366A (zh) 用于编码及检测带水印信号的装置
MY184847A (en) Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
DE69233236D1 (de) Ton- und Bild-Daten Verteilungsverfahren
CN101632118A (zh) 包括信息比特流转换的用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法
JP2009520382A5 (zh)
JPWO2019198540A1 (ja) 情報処理装置および方法、並びにプログラム
CN106448686B (zh) 一种自适应音频空域隐写方法
CN105247893A (zh) 音频信号输出装置和方法、编码装置和方法、解码装置和方法及程序
AU2003298146A1 (en) Method for describing the composition of audio signals
ATE205041T1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
CN105898669B (zh) 一种声音对象的编码方法
WO2022079049A3 (en) Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects
CN105761721A (zh) 一种携带位置信息的语音编码方法
CN113571048A (zh) 一种音频数据检测方法、装置、设备及可读存储介质
CN102647617B (zh) 一种前端装置及在前端实现视频指纹预处理的方法
TW200501055A (en) Class quantization for distributed speech recognition
CN109801639B (zh) 一种符合ac-3格式的全景声信号的编解码方法
MX2021001377A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo de codificacion de datos tridimensionales y dispositivo de decodificacion de datos tridimensionales.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Industrial Road, Songshan Lake high tech Industrial Development Zone, Guangdong city of Dongguan province No. 6 523808 1 5 floor

Applicant after: Jiahe intelligent Polytron Technologies Inc

Address before: Industrial Road, Songshan Lake high tech Industrial Development Zone, Guangdong city of Dongguan province No. 6 523808 1 5 floor

Applicant before: COSONIC ACOUSTIC TECHNOLOGY CO., LTD.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20160713

RJ01 Rejection of invention patent application after publication