KR100883656B1 - 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 - Google Patents
오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR100883656B1 KR100883656B1 KR1020060136823A KR20060136823A KR100883656B1 KR 100883656 B1 KR100883656 B1 KR 100883656B1 KR 1020060136823 A KR1020060136823 A KR 1020060136823A KR 20060136823 A KR20060136823 A KR 20060136823A KR 100883656 B1 KR100883656 B1 KR 100883656B1
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- term
- long
- audio signal
- classified
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000007774 longterm Effects 0.000 claims abstract description 105
- 230000003595 spectral effect Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000036039 immunity Effects 0.000 abstract description 4
- 230000010355 oscillation Effects 0.000 abstract description 2
- 238000011084 recovery Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 31
- 239000006185 dispersion Substances 0.000 description 26
- 230000001186 cumulative effect Effects 0.000 description 11
- 238000010606 normalization Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (21)
- 오디오 신호 분류 방법에 있어서,(a) 오디오 신호를 프레임 단위로 분석하여 상기 분석된 프레임에 따른 단구간 특성과 장구간 특성을 생성하는 단계;(b) 상기 생성된 장구간 특성을 이용하여 분류하고자 하는 프레임에 대한 분류 기준값을 적응적으로 조절하는 단계; 및(c) 상기 조절된 분류 기준값을 이용하여 상기 분류하고자 하는 프레임을 분류하는 단계를 포함하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 분류하고자 하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 단계를 더 포함하고, 상기 (b) 단계는 상기 비교 결과에 따라 분류 기준값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 장구간 특성을 생성하는 것은 상기 분류하고자 하는 프레임에 선행하는 소정 개수의 프레임에 따른 단구간 특성의 평균과 상기 분류하고자 하는 프레임에 따른 단구간 특성간의 차분값을 이용하여 생성하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 분류하고자 하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 단계를 더 포함하고,상기 (b) 단계는 상기 비교 결과와 상기 분류하고자 하는 프레임에 선행하는 프레임의 분류 결과를 이용하여 분류 기준값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제4항에 있어서,상기 (b) 단계는 상기 장구간 특성과 소정의 임계값의 비교 결과 상기 장구간 특성 만으로는 상기 분류하고자 하는 프레임을 분류하기 어려운 경우, 상기 분류하고자 하는 프레임이 상기 프레임에 선행하는 프레임과 동일하게 분류될 가능성이 높아지도록 상기 분류 기준값을 적응적으로 조절하는 단계 임을 특징으로 하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 (c) 단계는 상기 오디오 신호를 프레임 단위로 음성 신호 또는 음악 신호로 분류하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 (c) 단계는 상기 분류하고자 하는 프레임의 단구간 특성과 상기 조절된 분류 기준값의 대소 비교를 통해 상기 프레임을 분류하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제3항에 있어서,상기 장구간 특성을 생성하는 것은 상기 차분값이 소정의 기준값 보다 클 경우에는 분류하고자 하는 프레임에 대한 차분값과 상기 프레임에 선행하는 프레임에 대한 차분값에 각각 양(+)의 가중치를 부여하고, 가중치가 부여된 차분값 들을 합산하는 계산을 통해 장구간 특성을 생성하고,상기 차분값이 소정의 기준값 보다 작을 경우에는 상기 분류하고자 하는 프레임에 대한 차이값에는 음(-)의 가중치를 부여하고, 선행하는 프레임에 대한 차이값에 양(+)의 가중치를 부여하여 상기 가중치가 부여된 차이값을 합산하는 계산을 수행하거나 또는 선행하는 프레임에 따른 장구간 특성값을 감소시키는 계산을 통해 장구간 특성을 생성하는 것을 특징으로 하는 오디오 신호 분류 방법.
- 제8항에 있어서,상기 (c) 단계는 상기 오디오 신호를 프레임 단위로 음성 신호 또는 음악 신호로 분류하는 것이고, 상기 장구간 특성을 생성하는데 사용되는 상기 소정의 기준값은 음성 신호의 존재 가능성과 음악 신호의 존재 가능성의 차이가 가장 클 때의 차분값인 것을 특징으로 하는 오디오 신호 분류 방법.
- 제1항에 있어서,상기 단구간 특성은 단기/장기 예측 이득, 스펙트럼 틸트 및 영점 교차율로 이루어진 군으로부터 선택되는 1종 이상인 것을 특징으로 하는 오디오 신호 분류 방법.
- 제1항 내지 제10항 중 어느 한 항의 오디오 신호 분류 방법을 컴퓨터에서 수행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
- (a) 제1항 내지 제10항 중 어느 한 항의 오디오 신호 분류 방법에 따라 오디오 신호를 프레임 별로 분류하는 단계;(b) 상기 분류 결과에 따라 오디오 신호를 부호화하는 단계; 및(c) 상기 부호화된 신호에 대한 비트스트림 처리를 통해 비트스트림을 생성하는 단계를 포함하는 오디오 신호 부호화 방법.
- 제12항에 있어서, 상기 생성된 비트스트림은 오디오 신호의 분류 정보를 더 포함하는 것을 특징으로 하는 오디오 신호 부호화 방법.
- 제12항에 있어서, 상기 (b) 단계의 부호화는 상기 (a) 단계에서 음성 신호로 분류된 경우에는 시간 영역에서 부호화를 하고, 음악 신호로 분류된 경우에는 주파 수 영역에서 부호화를 하는 것임을 특징으로 하는 오디오 신호 부호화 방법.
- 오디오 신호를 프레임 단위로 분석하여 단구간 특성을 생성하는 단구간 특성 생성부;상기 생성된 단구간 특성을 이용하여 장구간 특성을 생성하는 장구간 특성 생성부;상기 생성된 장구간 특성을 이용하여 분류하고자 하는 프레임의 분류 기준값을 적응적으로 조절하는 분류 기준값 조절부; 및상기 적응적으로 조절된 분류 기준값을 이용하여 상기 분류하고자 하는 프레임을 분류하는 분류부를 포함하는 오디오 신호 분류 장치.
- 제15항에 있어서,상기 분류하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 장구간 특성 비교부를 더 포함하고,상기 분류부는 상기 분류하고자 하는 프레임에 선행하는 프레임의 장구간 특성과 상기 장구간 특성 비교부의 비교 결과를 이용하여 상기 분류하고자 하는 프레임을 분류하는 것을 특징으로 하는 오디오 신호 분류 장치.
- 제15항에 있어서,상기 장구간 특성 생성부는 상기 분류하고자 하는 프레임에 선행하는 소정 개수의 프레임에 따른 단구간 특성을 이용하여 제1 장구간 특성을 생성하는 제1 장구간 특성 생성부; 및상기 제1 장구간 특성 생성부로부터 생성된 제1 장구간 특성과 상기 분류하고자 하는 프레임과 상기 프레임에 선행하는 각각의 프레임에 대한 장구간 특성 들을 이용하여 제2 장구간 특성을 생성하는 제2 장구간 특성 생성부를 더 포함하고,상기 분류 기준값 조절부는 상기 제2 장구간 특성 생성부로부터 생성된 제2 장구간 특성을 이용하여 상기 분류하고자 하는 프레임의 분류 기준값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호 분류 장치.
- 제15항에 있어서,상기 단구간 특성 생성부는 LP-LTP 이득 생성부, 스펙트럼 틸트 생성부 및 영점 교차율 생성부로 이루어진 군으로부터 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호 분류 장치.
- 오디오 신호를 프레임 단위로 분석하여 단구간 특성을 생성하는 단구간 특성 생성부;상기 단구간 특성을 이용하여 장구간 특성을 생성하는 장구간 특성 생성부;상기 장구간 특성을 이용하여 분류하고자 하는 프레임의 분류 기준값을 적응적으로 조절하는 분류 기준값 조절부;상기 적응적으로 조절된 분류 기준값을 이용하여 상기 분류하고자 하는 프레 임을 분류하는 분류부;상기 분류부에 의하여 분류된 오디오 신호를 프레임 별로 부호화하는 부호화부; 및상기 부호화된 신호에 대한 비트스트림 처리를 통해 비트스트림을 생성하는 비트스트림 생성부를 포함하는 오디오 신호 부호화 장치.
- 오디오 신호의 장구간 특성에 따라 적응적으로 결정되는 오디오 신호의 프레임별 분류 정보를 포함하는 비트스트림을 수신하는 단계;상기 분류 정보에 따라 오디오 신호의 복호화 모드를 결정하는 단계; 및상기 결정된 복호화 모드에 따라 상기 수신된 비트스트림을 복호화하는 단계를 포함하는 오디오 신호 복호화 방법.
- 오디오 신호의 장구간 특성에 따라 적응적으로 결정되는 오디오 신호의 프레임별 분류 정보를 포함하는 비트스트림을 수신하는 수신부;상기 프레임별 분류 정보에 따라 수신된 비트스트림의 복호화 모드를 결정하는 복호화 모드 결정부; 및상기 결정된 복호화 모드에 따라 상기 수신된 비트스트림을 복호화하는 복호화부를 포함하는 오디오 신호의 복호화 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060136823A KR100883656B1 (ko) | 2006-12-28 | 2006-12-28 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
EP07860649A EP2102860A4 (en) | 2006-12-28 | 2007-12-26 | METHOD, MEDIUM AND APPARATUS FOR CLASSIFYING AUDIO SIGNAL, AND METHOD, MEDIUM AND APPARATUS FOR ENCODING AND / OR DECODING AUDIO SIGNAL USING THE SAME, METHOD, AND CLASSIFICATION APPARATUS |
PCT/KR2007/006811 WO2008082133A1 (en) | 2006-12-28 | 2007-12-26 | Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same |
US11/964,963 US20080162121A1 (en) | 2006-12-28 | 2007-12-27 | Method, medium, and apparatus to classify for audio signal, and method, medium and apparatus to encode and/or decode for audio signal using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060136823A KR100883656B1 (ko) | 2006-12-28 | 2006-12-28 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080061758A KR20080061758A (ko) | 2008-07-03 |
KR100883656B1 true KR100883656B1 (ko) | 2009-02-18 |
Family
ID=39585193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060136823A KR100883656B1 (ko) | 2006-12-28 | 2006-12-28 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20080162121A1 (ko) |
EP (1) | EP2102860A4 (ko) |
KR (1) | KR100883656B1 (ko) |
WO (1) | WO2008082133A1 (ko) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0718738B1 (pt) | 2006-12-12 | 2023-05-16 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo |
EP2198426A4 (en) * | 2007-10-15 | 2012-01-18 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING A SIGNAL |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
WO2010003521A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and discriminator for classifying different segments of a signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101756834B1 (ko) | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
KR101601906B1 (ko) * | 2008-07-18 | 2016-03-10 | 삼성전자주식회사 | 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며오디오 신호를 부호화하는 장치 및 방법 |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
JP5555707B2 (ja) * | 2008-10-08 | 2014-07-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチ分解能切替型のオーディオ符号化及び復号化スキーム |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码*** |
US9269366B2 (en) * | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
CN105355209B (zh) | 2010-07-02 | 2020-02-14 | 杜比国际公司 | 音高增强后置滤波器 |
US9711158B2 (en) | 2011-01-25 | 2017-07-18 | Nippon Telegraph And Telephone Corporation | Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium |
CN102982804B (zh) * | 2011-09-02 | 2017-05-03 | 杜比实验室特许公司 | 音频分类方法和*** |
CN103000172A (zh) * | 2011-09-09 | 2013-03-27 | 中兴通讯股份有限公司 | 信号分类方法和装置 |
US9111531B2 (en) | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
US9984706B2 (en) * | 2013-08-01 | 2018-05-29 | Verint Systems Ltd. | Voice activity detection using a soft decision mechanism |
CN104347067B (zh) | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
JP6599368B2 (ja) * | 2014-02-24 | 2019-10-30 | サムスン エレクトロニクス カンパニー リミテッド | 信号分類方法及びその装置、並びにそれを利用したオーディオ符号化方法及びその装置 |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10186276B2 (en) * | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
KR101702565B1 (ko) * | 2016-03-03 | 2017-02-03 | 삼성전자 주식회사 | 주파수 영역 변환 기법 및 시간 영역 변환 기법을 전환하며 오디오 신호를 부호화하는 장치 및 방법 |
CN111261143B (zh) * | 2018-12-03 | 2024-03-22 | 嘉楠明芯(北京)科技有限公司 | 一种语音唤醒方法、装置及计算机可读存储介质 |
US10728676B1 (en) * | 2019-02-01 | 2020-07-28 | Sonova Ag | Systems and methods for accelerometer-based optimization of processing performed by a hearing device |
US20220199074A1 (en) * | 2019-04-18 | 2022-06-23 | Dolby Laboratories Licensing Corporation | A dialog detector |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175098A (ja) | 1997-12-12 | 1999-07-02 | Nec Corp | 音声及び音楽符号化方式 |
US20030101050A1 (en) | 2001-11-29 | 2003-05-29 | Microsoft Corporation | Real-time speech and music classifier |
KR20030070178A (ko) * | 2002-02-21 | 2003-08-29 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
KR20050046204A (ko) * | 2003-11-13 | 2005-05-18 | 한국전자통신연구원 | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
TW271524B (ko) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5751903A (en) * | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6330533B2 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6260010B1 (en) * | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
JP2000267699A (ja) * | 1999-03-19 | 2000-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 |
US7010480B2 (en) * | 2000-09-15 | 2006-03-07 | Mindspeed Technologies, Inc. | Controlling a weighting filter based on the spectral content of a speech signal |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
KR100964402B1 (ko) * | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
-
2006
- 2006-12-28 KR KR1020060136823A patent/KR100883656B1/ko not_active IP Right Cessation
-
2007
- 2007-12-26 EP EP07860649A patent/EP2102860A4/en not_active Withdrawn
- 2007-12-26 WO PCT/KR2007/006811 patent/WO2008082133A1/en active Application Filing
- 2007-12-27 US US11/964,963 patent/US20080162121A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175098A (ja) | 1997-12-12 | 1999-07-02 | Nec Corp | 音声及び音楽符号化方式 |
US20030101050A1 (en) | 2001-11-29 | 2003-05-29 | Microsoft Corporation | Real-time speech and music classifier |
KR20030070178A (ko) * | 2002-02-21 | 2003-08-29 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
KR20050046204A (ko) * | 2003-11-13 | 2005-05-18 | 한국전자통신연구원 | 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법 |
Also Published As
Publication number | Publication date |
---|---|
EP2102860A1 (en) | 2009-09-23 |
KR20080061758A (ko) | 2008-07-03 |
WO2008082133A1 (en) | 2008-07-10 |
US20080162121A1 (en) | 2008-07-03 |
EP2102860A4 (en) | 2011-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100883656B1 (ko) | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 | |
KR100964402B1 (ko) | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 | |
TWI441166B (zh) | 用以將信號之不同區段分類之方法與鑑別器 | |
US7472059B2 (en) | Method and apparatus for robust speech classification | |
KR101116363B1 (ko) | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 | |
EP1982329B1 (en) | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus | |
KR20080101872A (ko) | 부호화/복호화 장치 및 방법 | |
KR20080083719A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
JP2010540990A (ja) | 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置 | |
KR100546758B1 (ko) | 음성의 상호부호화시 전송률 결정 장치 및 방법 | |
KR20070085788A (ko) | 신호 속성들을 사용한 효율적인 오디오 코딩 | |
Ojala | Toll quality variable-rate speech codec | |
Iao | Mixed wideband speech and music coding using a speech/music discriminator | |
KR20070017379A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
Ritz et al. | Transcoding of Narrowband to Wideband Speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130130 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140128 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150129 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160128 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170125 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180130 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |