KR100757858B1 - Optional encoding system and method for operating the system - Google Patents

Optional encoding system and method for operating the system Download PDF

Info

Publication number
KR100757858B1
KR100757858B1 KR1020050091846A KR20050091846A KR100757858B1 KR 100757858 B1 KR100757858 B1 KR 100757858B1 KR 1020050091846 A KR1020050091846 A KR 1020050091846A KR 20050091846 A KR20050091846 A KR 20050091846A KR 100757858 B1 KR100757858 B1 KR 100757858B1
Authority
KR
South Korea
Prior art keywords
audio data
user terminal
data
user
information
Prior art date
Application number
KR1020050091846A
Other languages
Korean (ko)
Other versions
KR20070036870A (en
Inventor
전윤호
Original Assignee
와이더댄 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 와이더댄 주식회사 filed Critical 와이더댄 주식회사
Priority to KR1020050091846A priority Critical patent/KR100757858B1/en
Priority to PCT/KR2006/003903 priority patent/WO2007037641A1/en
Priority to CN2006800359075A priority patent/CN101273405B/en
Publication of KR20070036870A publication Critical patent/KR20070036870A/en
Application granted granted Critical
Publication of KR100757858B1 publication Critical patent/KR100757858B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 소정의 서버로부터 오디오 데이터를 수신하고, 소정의 인코더를 통해 상기 오디오 데이터를 인코딩 후 사용자 단말기로 제공하는 방법에 관한 것이다. 본 발명에 따르면, 오디오 데이터를 기록하는 휴대용 단말기의 메모리 수단에 대한 사용 효율을 제고할 수 있을 뿐 아니라, 선택적 인코딩 시스템에서 오디오 데이터를 데이터의 특성에 따라 인코딩하여 무선 통신망을 통해 제2 사용자 단말기로 전송함으로써 상기 무선 통신망에 발생되는 부하를 줄일 수 있다.The present invention relates to a method for receiving audio data from a predetermined server and providing the audio data to a user terminal after encoding the predetermined data through a predetermined encoder. According to the present invention, it is possible not only to improve the use efficiency of the memory means of the portable terminal for recording audio data, but also to encode the audio data according to the characteristics of the data in the selective encoding system to the second user terminal through the wireless communication network. By transmitting, the load generated on the wireless communication network can be reduced.

파드캐스팅, RSS, 오디오, 보코더, 디코더, 인코더, 코덱 Podcasting, RSS, Audio, Vocoder, Decoder, Encoder, Codec

Description

선택적 인코딩 시스템 및 상기 선택적 인코딩 시스템의 동작 방법{OPTIONAL ENCODING SYSTEM AND METHOD FOR OPERATING THE SYSTEM}Selective encoding system and operation method of the selective encoding system {OPTIONAL ENCODING SYSTEM AND METHOD FOR OPERATING THE SYSTEM}

도 1은 본 발명에 따른 선택적 인코딩 시스템, 서버, 및 제2 사용자 단말기를 포함하는 네트워크를 도시한 도면이다.1 is a diagram illustrating a network including an optional encoding system, a server, and a second user terminal according to the present invention.

도 2는 본 발명에 따른 선택적 인코딩 방법에 따른 단계를 도시한 흐름도이다.2 is a flowchart illustrating steps according to a selective encoding method according to the present invention.

도 3 및 도 4는 본 발명에 따른 선택적 인코딩 시스템, 서버, 및 제2 사용자 단말기를 포함하는 네트워크의 일례를 도시한 도면이다.3 and 4 illustrate an example of a network including an optional encoding system, a server, and a second user terminal according to the present invention.

도 5는 본 발명의 일실시예에 따른 오디오 데이터 및 제2 오디오 데이터의 데이터 포맷을 도시한 도면이다.5 is a diagram illustrating a data format of audio data and second audio data according to an embodiment of the present invention.

도 6은 본 발명의 일실시예에 따른 선택적 인코딩 시스템의 내부 구성을 도시한 블록도이다.6 is a block diagram illustrating an internal configuration of a selective encoding system according to an embodiment of the present invention.

도 7은 본 발명에 따른 선택적 인코딩 방법을 수행하는데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.7 is an internal block diagram of a general purpose computer device that may be employed to perform the selective encoding method according to the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for main parts of the drawings>

600: 선택적 인코딩 시스템 601: 수신부600: optional encoding system 601: receiver

602: 변환부 603: 전송부602: converter 603: transmitter

604: 사용자 데이터베이스 605: 데이터베이스 관리부604: user database 605: database management unit

본 발명은 소정의 서버로부터 오디오 데이터를 수신하고, 소정의 인코더를 통해 상기 오디오 데이터를 인코딩 후 사용자 단말기로 제공하는 방법에 관한 것이다. 이 때, 상기 인코더는 상기 오디오 데이터의 특성에 따라 선택적으로 설정될 수 있으며, 상기 오디오 데이터가 음성 데이터를 소정 비율 이상 포함하는 경우에 상기 인코더는 QCELP, EVRC, 또는 AMR 등을 사용하는 구성을 포함한다.The present invention relates to a method for receiving audio data from a predetermined server and providing the audio data to a user terminal after encoding the predetermined data through a predetermined encoder. In this case, the encoder may be selectively set according to the characteristics of the audio data, and when the audio data includes voice data more than a predetermined ratio, the encoder may include a configuration using QCELP, EVRC, or AMR. do.

오늘날 인터넷의 발달과 더불어 오디오 컨텐츠를 저장하고 필요 시 이를 재생하는 휴대용 단말기가 널리 보급되고 있다. 일례로, 파드캐스팅(podcasting) 서비스와 같이 오디오 컨텐츠를 휴대용 단말기에 다운로드하여 이용하는 경우, 상기 오디오 컨텐츠는 컴퓨터 단말기로 다운로드 된다. 이 때, MP3 또는 ACC 방식 등의 오디오 압축 기술에 따라 인코딩(encoding)된 오디오 컨텐츠는 MP3 플레이어 또는 휴대폰 등의 휴대용 단말기로 전송된다. 상기 휴대용 단말기는 상기 압축된 오디오 컨텐츠를 디코딩(decoding)하여 재생한다. 또한, 상기 컴퓨터 단말기는 뉴스 방송 등의 오디오 컨텐츠를 RSS(Rich Site Summary) 서버 등의 오디오 데이터 제공서버로부터 소정의 주기로 다운로드하고, 상기 오디오 컨텐츠를 인코딩하여 상기 휴대용 단말기에 제공한다.Today, with the development of the Internet, portable terminals for storing audio contents and playing them when necessary are widely used. For example, when audio content is downloaded to a portable terminal and used, such as a podcasting service, the audio content is downloaded to a computer terminal. At this time, audio content encoded according to an audio compression technology such as MP3 or ACC is transmitted to a portable terminal such as an MP3 player or a mobile phone. The portable terminal decodes and reproduces the compressed audio content. The computer terminal downloads audio content such as a news broadcast from an audio data providing server such as a RSS (Rich Site Summary) server at predetermined intervals, encodes the audio content, and provides the audio content to the portable terminal.

이 때 휴대용 단말기는 상기 오디오 컨텐츠를 기록하기 위한 메모리 수단을 더 포함하고, 상기 오디오 컨텐츠는 상기 휴대용 단말기의 상기 메모리 수단에 기록될 수 있다.In this case, the portable terminal may further include a memory means for recording the audio content, and the audio content may be recorded in the memory means of the portable terminal.

그러나, 현재 널리 이용되고 있는 휴대용 단말기는 일반적으로 수십 또는 수백 MB(Mega Byte) 단위의 메모리 용량을 가지고 있다. 이러한 메모리 용량은 높은 비트레이트(bit rate)로 인코딩된 오디오 컨텐츠를 기록하기에 충분하지 못할 수 있다. 따라서, 메모리 수단에 기록되는 오디오 컨텐츠를 최대한 압축 또는 인코딩하는 기술적 사상이 필요한 실정이다. However, currently widely used portable terminals generally have a memory capacity of tens or hundreds of megabytes (MB). Such memory capacity may not be sufficient to record audio content encoded at a high bit rate. Accordingly, there is a need for a technical idea of compressing or encoding audio content recorded in a memory device as much as possible.

즉, 소정의 서버로부터 수신하는 상기 오디오 데이터는 수신 시 이미 특정 방식으로 인코딩되어 있으며, 상기 특정 방식으로 인코딩된 오디오 데이터를 상기 오디오 데이터의 특성에 따라 재인코딩(trascoding) 후 상기 휴대용 단말기에 전송함으로써, 상기 휴대용 단말기의 메모리 효율 증가 및 전송 채널의 부하를 절감할 수 있는 기술적 사상이 필요하다.That is, the audio data received from a predetermined server is already encoded in a specific manner upon reception, and the audio data encoded in the specific scheme is re-encoded according to the characteristics of the audio data and then transmitted to the portable terminal. There is a need for a technical idea that increases the memory efficiency of the portable terminal and reduces the load on the transmission channel.

일례로, 음악등의 오디오 데이터는 MP3 방식으로 인코딩 시 대개 128Kbps 이상의 비트 레이트로 압축되며, 음질이 크게 문제되지 않는 음성 위주의 컨텐트라도 최소한 32Kbps 이상의 비트레이트가 필요한 반면, 사람의 음성에 최적화된 보코더(vocoder), 예를 들어 EVRC의 경우는 8Kbps의 낮은 비트레이트로 압축할 수 있다. For example, audio data such as music is compressed at a bit rate of 128 Kbps or more when MP3 encoded, and at least 32 Kbps bitrate is required, even for voice-oriented content in which sound quality is not a problem. (vocoder), for example EVRC can be compressed to a low bit rate of 8Kbps.

그러나, 종래의 기술에 따른 RSS 또는 파드캐스팅 등에서는 음성 데이터 또는 음악 데이터를 구분하지 않고, 일괄적으로 MP3 또는 ACC 등의 인코딩 방식으로 음원이 제공되는 것이 일반적이다. 따라서, 휴대용 단말기는 필요 이상의 비트레이트로 압축된 음성 데이터를 저장하는 경우가 종종 발생한다. 이로 인해 휴대용 단말기의 메모리를 효율적으로 사용하지 못하고 있다는 문제점이 있다.However, in RSS or podcasting according to the prior art, it is common to provide a sound source in a batch manner such as MP3 or ACC without discriminating voice data or music data. Therefore, portable terminals often store voice data compressed at bitrates more than necessary. As a result, there is a problem in that the memory of the portable terminal cannot be efficiently used.

본 발명은 상기와 같은 종래기술을 개선하기 위해 안출된 것으로서, 휴대용 단말기의 메모리 수단에 대한 사용 효율을 제고하는 것이다.The present invention has been made to improve the prior art as described above, to improve the use efficiency of the memory means of the portable terminal.

본 발명의 또 다른 목적은, 선택적 인코딩 시스템에서 오디오 데이터를 데이터의 특성에 따라 인코딩하여 무선 통신망을 통해 제2 사용자 단말기로 전송함으로써, 상기 무선 통신망 부하를 줄이는 것이다.Still another object of the present invention is to reduce the wireless network load by encoding audio data according to the characteristics of data in a selective encoding system and transmitting the same to a second user terminal through the wireless network.

상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명에 따른 선택적 인코딩 시스템의 동작 방법은 소정의 서버로부터 오디오 데이터를 수신하는 단계, 상기 오디오 데이터의 데이터 포맷을 분석하여 음성 데이터인지 여부를 판단하는 단계, 상기 오디오 데이터에 상기 음성 데이터가 포함되어 있는 경우, 상기 오디오 데이터를 소정의 보코더(vocoder)를 통해 인코딩하여 제2 오디오 데이터를 생성하는 단계 - 상기 제2 오디오 데이터는 상기 보코더(vocoder) 및 상기 인코딩(encoding)에 대한 변환정보를 포함함 -, 및 생성된 상기 제2 오디오 데이터를 제2 사용자 단말기로 전송하는 단계를 포함하고, 상기 제2 사용자 단말기는 상기 변환정보에 따라 상기 제2 오디오 데이터를 디코딩(decoding)하는 것을 특징으로 한다.In order to achieve the above object and to solve the above-mentioned problems of the prior art, the operation method of the selective encoding system according to the present invention comprises the steps of receiving audio data from a server, analyzing the data format of the audio data voice Determining whether the data is data, and when the audio data includes the voice data, generating the second audio data by encoding the audio data through a predetermined vocoder, wherein the second audio data is And the conversion information about the vocoder and the encoding, and transmitting the generated second audio data to a second user terminal, wherein the second user terminal transmits the conversion information. The second audio data is decoded according to the present invention.

또한, 본 발명에 따른 선택적 인코딩 시스템은 소정의 서버로부터 오디오 데이터를 수신하는 수신부, 상기 오디오 데이터의 데이터 포맷을 분석하여 음성 데이 터인지 여부를 판단하고, 상기 오디오 데이터가 상기 음성 데이터를 포함하는 경우 상기 오디오 데이터를 소정의 보코더(vocoder)를 통해 인코딩하여 제2 오디오 데이터를 생성하는 변환부 - 상기 제2 오디오 데이터는 상기 보코더(vocoder) 및 상기 인코딩(encoding)에 대한 변환정보를 포함함 -, 및 생성된 상기 제2 오디오 데이터를 제2 사용자 단말기로 전송하는 전송부를 포함하고, 상기 제2 사용자 단말기는 상기 변환정보에 따라 상기 제2 오디오 데이터를 디코딩(decoding)하는 것을 특징으로 한다.In addition, the selective encoding system according to the present invention is a receiver for receiving audio data from a server, by analyzing the data format of the audio data to determine whether or not the voice data, when the audio data includes the voice data A converter configured to generate second audio data by encoding the audio data through a predetermined vocoder, wherein the second audio data includes conversion information about the vocoder and the encoding; And a transmission unit configured to transmit the generated second audio data to a second user terminal, wherein the second user terminal decodes the second audio data according to the conversion information.

이하 첨부된 도면을 참조하여, 본 발명에 따른 선택적 인코딩 방법 및 선택적 인코딩 시스템에 대하여 상세히 설명한다.Hereinafter, an optional encoding method and an optional encoding system according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 선택적 인코딩 시스템, 서버, 및 제2 사용자 단말기를 포함하는 네트워크를 도시한 도면이다.1 is a diagram illustrating a network including an optional encoding system, a server, and a second user terminal according to the present invention.

도 1을 참조하면, 본 발명에 따른 선택적 인코딩 시스템(100)은 서버(110)로부터 소정의 오디오 데이터를 수신한다. 본 발명의 일실시예에 따른 서버(110)는 파드캐스팅 서비스 또는 RSS 서비스를 제공한다. 따라서, 선택적 인코딩 시스템(100)은 소정의 주기로 서버(110)로부터 상기 오디오 데이터를 수신한다. 또한, 상기 오디오 데이터는 노래, 음성, 또는 방송 데이터를 포함할 수 있다.Referring to FIG. 1, the selective encoding system 100 according to the present invention receives predetermined audio data from the server 110. Server 110 according to an embodiment of the present invention provides a podcasting service or RSS service. Accordingly, the selective encoding system 100 receives the audio data from the server 110 at predetermined intervals. In addition, the audio data may include song, voice, or broadcast data.

상기 오디오 데이터를 수신한 선택적 인코딩 시스템(100)은 상기 오디오 데이터를 분석하여, 음성 데이터인지 여부를 확인한다. 상기 오디오 데이터를 분석하여 음성 데이터인지 여부를 확인하는 것은 종래 기술을 사용할 수 있다. 일례로, 상기 오디오 데이터가 주로 사람의 음성으로 이루어져 있는지를 판단하기 위하 여, 상기 오디오 데이터에 일정 비율 이상으로 소리가 끊어지는지를 확인할 수 있다. 또한, 상기 오디오 데이터에 소정의 pitch가 검출되는지 여부 또는 상기 오디오 데이터의 주파수를 확인하여 특정 대역에 주파수의 밀집 여부 등을 통해 상기 오디오 데이터가 음성 데이터인지를 판단할 수 있다. 또한, 현재 이동통신 단말기는 음성 채널에 있어서, 사용자 간 음성 송수신이 없는 경우 VAD(Voice Activity Detector), DTX(Discontinuous Transmission), 또는 VRC(Variable Rate Codec) 등의 기능을 통해 실시간으로 전송 대역을 조절한다. 실시간으로 음성 여부를 확인하는 상기 이동통신 단말기와는 달리 본 발명에 따른 선택적 인코딩 시스템(100)은 오디오 데이터를 분석하는 시간적 여유가 더 많기 때문에 오디오 데이터의 음성 데이터 포함 여부를 비교적 정밀하게 판단할 수 있다.Upon receiving the audio data, the selective encoding system 100 analyzes the audio data to determine whether the audio data is voice data. Analyzing the audio data to determine whether it is voice data may use conventional techniques. For example, in order to determine whether the audio data mainly consists of a human voice, it may be determined whether the audio data is cut off by a predetermined ratio or more. In addition, whether a predetermined pitch is detected in the audio data or the frequency of the audio data may be checked to determine whether the audio data is voice data based on whether a frequency is concentrated in a specific band. In addition, the current mobile communication terminal adjusts the transmission band in real time through a function such as Voice Activity Detector (VAD), Discontinuous Transmission (VTX), or Variable Rate Codec (VRC) when there is no voice transmission and reception between users in the voice channel. do. Unlike the mobile communication terminal which checks the voice in real time, the selective encoding system 100 according to the present invention has more time to analyze the audio data, and thus it is possible to accurately determine whether the audio data includes the voice data. have.

서버(110)로부터 오디오 데이터를 수신한 선택적 인코딩 시스템(100)은 상기 오디오 데이터가 음성 데이터인지 여부를 판단하고, 상기 음성 데이터인 경우에 소정의 보코더를 통해 상기 음성 데이터를 인코딩한다. 본 발명의 일실시예에 따른 선택적 인코딩 시스템(100)은 QCELP(Qualcomm Code Excited Linear Prediction), EVRC(Enhanced Voice Rated Codec), 또는 AMR(Adaptive Multi-Rate) 등의 보코더를 사용할 수 있다.Upon receiving audio data from the server 110, the selective encoding system 100 determines whether the audio data is voice data, and in the case of the voice data, encodes the voice data through a predetermined vocoder. The selective encoding system 100 according to an embodiment of the present invention may use a vocoder such as Qualcomm Code Excited Linear Prediction (QCELP), Enhanced Voice Rated Codec (EVRC), or Adaptive Multi-Rate (AMR).

상기 오디오 데이터는 상기 보코더를 통해 인코딩 후 제2 오디오 데이터로 생성된다. 상기 제2 오디오 데이터는 음성 데이터를 포함하는 오디오 데이터로써 EVRC를 사용하는 경우 대략 8Kbps의 비트레이트로 인코딩될 수 있다. 또한, 상기 오디오 데이터가 음성 데이터가 아닌 음악 또는 노래 데이터인 경우에 선택적 인코 딩 시스템(100)은 상기 오디오 데이터를 다시 인코딩하지 않는다.The audio data is generated as second audio data after encoding through the vocoder. The second audio data may be encoded at a bit rate of approximately 8 Kbps when using EVRC as audio data including voice data. In addition, when the audio data is music or song data rather than voice data, the selective encoding system 100 does not re-encode the audio data.

제2 사용자 단말기(120)는 선택적 인코딩 시스템(100)으로부터 상기 제2 오디오 데이터를 수신한다.The second user terminal 120 receives the second audio data from the selective encoding system 100.

본 발명의 일실시예에 따른 선택적 인코딩 시스템(100)은 파드캐스팅 서비스 또는 이와 유사한 방식으로 오디오 컨텐츠가 제공되는 서비스로부터 오디오 데이터를 수신하는 컴퓨터 단말기이다. 따라서, 선택적 인코딩 시스템(100)은 유무선의 인터넷 통신망을 통해 서버(110)로부터 상기 오디오 데이터를 수신한다. 또한, 상기 오디오 데이터를 선택적으로 상기 제2 오디오 데이터를 인코딩하거나 상기 오디오 데이터를 그대로 제2 사용자 단말기(120)로 전송한다. 이 때, 제2 사용자 단말기(120)는 이동통신 단말기, MP3 플레이어, PSP, PMP, PDA, 또는 전자수첩 등의 휴대용 단말기이고, 상기 컴퓨터 단말기는 제2 사용자 단말기(120)와 접속하여 상기 제2 오디오 데이터를 전송한다.Selective encoding system 100 according to an embodiment of the present invention is a computer terminal for receiving audio data from a podcasting service or a service in which audio content is provided in a similar manner. Accordingly, the selective encoding system 100 receives the audio data from the server 110 through a wired or wireless internet communication network. In addition, the audio data may be selectively encoded by the second audio data or the audio data may be transmitted to the second user terminal 120 as it is. In this case, the second user terminal 120 is a mobile terminal such as a mobile communication terminal, an MP3 player, a PSP, a PMP, a PDA, or an electronic notebook, and the computer terminal is connected to the second user terminal 120 to connect the second terminal. Send audio data.

본 발명의 일실시예에 따른 선택적 인코딩 시스템(100)은 소정의 독립된 서버이다. 따라서, 선택적 인코딩 시스템(100)은 서버(110)로부터 유무선 통신망을 통해 상기 오디오 데이터를 수신하고, 상기 오디오 데이터로부터 선택적으로 상기 제2 오디오 데이터를 생성하거나 상기 오디오 데이터를 그대로 제2 사용자 단말기(120)로 전송한다. 이 때, 제2 사용자 단말기(120)는 이동통신 단말기이고, 선택적 인코딩 시스템(100)은 데이터 채널을 통해 상기 이동통신 단말기로 상기 제2 오디오 데이터를 무선 전송한다.The selective encoding system 100 according to an embodiment of the present invention is a predetermined independent server. Accordingly, the selective encoding system 100 receives the audio data from the server 110 through a wired / wireless communication network, selectively generates the second audio data from the audio data, or leaves the audio data as it is in the second user terminal 120. To send). In this case, the second user terminal 120 is a mobile communication terminal, and the selective encoding system 100 wirelessly transmits the second audio data to the mobile communication terminal through a data channel.

이로써, 본 발명에 따른 선택적 인코딩 시스템(100)은 서버(110)로 수신하는 오디오 데이터의 특성에 따라 인코딩 방법을 달리함으로써, 제2 사용자 단말기(120)의 메모리 효율의 증가 또는 전송 채널의 부하 감소 등의 효과를 얻을 수 있다.Accordingly, the selective encoding system 100 according to the present invention changes the encoding method according to the characteristics of the audio data received by the server 110, thereby increasing the memory efficiency of the second user terminal 120 or reducing the load of the transmission channel. And the like can be obtained.

도 2는 본 발명에 따른 선택적 인코딩 방법에 따른 단계를 도시한 흐름도이다.2 is a flowchart illustrating steps according to a selective encoding method according to the present invention.

단계(201)에서, 서버는 본 발명의 일실시예에 따른 선택적 인코딩 시스템으로 소정의 오디오 데이터를 전송한다. 상기 서버는 파드캐스팅 서비스 또는 RSS 서비스를 제공하는 시스템이다. 이에 따라, 상기 선택적 인코딩 시스템은 상기 서버를 소정의 주기로 확인하여 새로 갱신된 오디오 데이터 목록을 확인하고, 상기 새로 갱신된 오디오 데이터가 존재하는 경우에 상기 오디오 데이터를 송신 요청한다.In step 201, the server transmits certain audio data to the selective encoding system according to one embodiment of the present invention. The server is a system for providing a podcasting service or an RSS service. Accordingly, the selective encoding system checks the server at predetermined intervals to check the newly updated audio data list, and requests transmission of the audio data when the newly updated audio data exists.

단계(202)에서, 상기 선택적 인코딩 시스템은 상기 서버로부터 상기 오디오 데이터를 수신하고, 데이터 포맷을 분석한다. 상기 오디오 데이터는 방송, 음악, 노래 또는 음성 등의 데이터를 포함한다. 따라서, 상기 오디오 데이터는 상기 데이터 포맷에 따라 특정한 성질을 갖게 되며, 상기 특정한 성질은 주파수 대역, pitch 검출, 또는 소리의 끊어짐 여부 등의 분석을 통해 특성을 판단할 수 있다. 이러한, 오디오 데이터의 특성을 판단하는 것을 종래 기술을 그대로 사용한다.In step 202, the selective encoding system receives the audio data from the server and analyzes the data format. The audio data includes data such as broadcast, music, song or voice. Accordingly, the audio data has a specific property according to the data format, and the specific property may be determined by analyzing a frequency band, pitch detection, or whether the sound is broken. The conventional technique is used as it is to determine the characteristics of the audio data.

단계(203)에서, 상기 데이터 포맷의 분석 결과에 따라 상기 오디오 데이터가 음성 데이터인지 판단한다. 상기 선택적 인코딩 시스템은 상기 주파수 대역, pitch 검출, 또는 소리의 끊어짐 여부 등의 분석을 통해 상기 오디오 데이터가 음 성 데이터를 포함하는지 여부를 판단한다. 본 발명의 일실시예에 따른 선택적 인코딩 시스템은 하나의 오디오 데이터를 소정의 부분으로 구분하고, 각 부분에 대하여 음성 데이터의 포함 여부를 확인한다. 이 경우에 각각 부분에 대한 인덱스 및 상기 인덱스에 대한 음성 데이터 여부를 소정의 메모리 수단에 기록한다.In step 203, it is determined whether the audio data is voice data according to the analysis result of the data format. The selective encoding system determines whether the audio data includes voice data through analysis of the frequency band, pitch detection, or whether the sound is cut off. The selective encoding system according to an embodiment of the present invention divides one piece of audio data into predetermined portions and checks whether or not the speech data is included in each portion. In this case, an index for each part and voice data for the index are recorded in predetermined memory means.

또한, 단계(203)에서, 상기 데이터 포맷의 분석 결과 상기 오디오 데이터가 음성 데이터가 아닌 경우에 단계(206)으로 분기함으로써, 상기 오디오 데이터를 제2 사용자 단말기로 그대로 전송한다.Further, in step 203, if the audio data is not voice data as a result of analysis of the data format, branching to step 206 transmits the audio data to the second user terminal as it is.

상기 오디오 데이터에 상기 음성 데이터가 포함되어 있는 경우, 단계(204)에서 상기 선택적 인코딩 시스템은 상기 오디오 데이터를 소정의 보코더(vocoder)를 통해 인코딩하고, 단계(205)에서 제2 데이터를 생성한다.If the audio data contains the voice data, in step 204 the selective encoding system encodes the audio data via a predetermined vocoder and generates second data in step 205.

상기 오디오 데이터가 상기 음성 데이터를 소정 비율 이상 포함하는 경우에 상기 오디오 데이터는 비교적 적은 비트레이트를 사용하는 보코더를 통해 인코딩한다. 상기 소정 비율은 선택적 인코딩 시스템의 개발자 또는 관리자가 설정할 수 있다.When the audio data contains the voice data more than a predetermined ratio, the audio data is encoded through a vocoder using a relatively low bit rate. The predetermined ratio may be set by the developer or administrator of the selective encoding system.

본 발명의 일실시예에 따른 선택적 인코딩 시스템은 상기 오디오 데이터 중 음성 데이터로 구성된 소정의 부분에 대하여 상기 보코더를 통해 인코딩한다. 일례로, 중간 부분이 음성 데이터로 구성된 오디오 데이터를 인코딩하기 위하여, 상기 선택적 인코딩 시스템은 상기 중간 부분만을 보코더를 통해 인코딩하고, 상기 중간 부분의 시작위치에 소정의 플래그 또는 인덱스 정보 등의 식별 정보를 삽입하거나, 보코더 정보 등의 변환정보를 추가하여 재조합 함으로써 제2 오디오 데이터 를 생성한다.The selective encoding system according to an embodiment of the present invention encodes a predetermined portion of the audio data through voice vocoder. For example, in order to encode audio data in which the middle portion is composed of voice data, the selective encoding system encodes only the middle portion through a vocoder, and inputs identification information such as predetermined flag or index information at the start of the middle portion. The second audio data is generated by inserting or recombining conversion information such as vocoder information.

단계(206)에서, 상기 선택적 인코딩 시스템은 생성된 상기 제2 오디오 데이터를 제2 사용자 단말기로 전송한다.In step 206, the selective encoding system transmits the generated second audio data to a second user terminal.

본 발명의 일실시예에 따른 선택적 인코딩 시스템은 사용자의 컴퓨터 단말기 상에서 구현될 수 있고, 상기 제2 사용자 단말기는 휴대폰, PDA, 전자수첩, PMP, PSP, 또는 MP3 플레이어 등의 휴대용 단말기일 수 있다. 상기 일실시예는 도 3을 참조하여 상세히 설명한다.The selective encoding system according to an embodiment of the present invention may be implemented on a user's computer terminal, and the second user terminal may be a portable terminal such as a mobile phone, a PDA, an electronic notebook, a PMP, a PSP, or an MP3 player. The embodiment will be described in detail with reference to FIG. 3.

도 3은 본 발명에 따른 선택적 인코딩 시스템, 서버, 및 제2 사용자 단말기를 포함하는 네트워크의 일례를 도시한 도면이다.3 is a diagram illustrating an example of a network including a selective encoding system, a server, and a second user terminal according to the present invention.

도 3을 참조하면, 선택적 인코딩 시스템(300)은 컴퓨터 단말기(310) 상에서 구현될 수 있다. 즉, 선택적 인코딩 시스템(300)은 컴퓨터 단말기(310)에 설치된 소정의 응용프로그램 또는 하드웨어이다. 서버(301)는 파드캐스팅 서비스 또는 RSS 서비스에 따라 소정의 주기로 컴퓨터 단말기에 네트워크(302)를 통해 오디오 데이터를 전송한다. 네트워크(302)는 컴퓨터 단말기(310)에 인터넷 통신 능력을 제공하기 위한 유무선 네트워크로 고려될 수 있다. 네트워크(302)를 통해 오디오 데이터를 수신한 컴퓨터 단말기(310)는 선택적 인코딩 시스템(300)에서 상기 오디오 데이터의 음성 데이터 포함 여부를 판단한다. 상기 오디오 데이터에 상기 음성 데이터가 포함된 경우, 선택적 인코딩 시스템(300)은 상기 오디오 데이터를 보코더를 통해 인코딩 후 제2 오디오 데이터를 생성한다. 제2 사용자 단말기가 컴퓨터 단말기(310)에 접속된 경우 컴퓨터 단말기(310)는 상기 제2 사용자 단말기로 선택적 인 코딩 시스템(300)이 생성한 상기 제2 오디오 데이터를 전송한다. 상기 제2 사용자 단말기는 MP3 플레이어(304), 이동통신 단말기(305), 또는 플레이 스테이션(306) 등, 소정의 메모리 수단을 구비한 휴대용 단말기이다.Referring to FIG. 3, an optional encoding system 300 may be implemented on computer terminal 310. That is, the selective encoding system 300 is any application or hardware installed in the computer terminal 310. The server 301 transmits audio data through the network 302 to the computer terminal at predetermined intervals according to the podcasting service or the RSS service. The network 302 may be considered a wired or wireless network for providing internet communication capability to the computer terminal 310. The computer terminal 310 that receives the audio data through the network 302 determines whether the audio data is included in the selective encoding system 300. When the audio data includes the voice data, the selective encoding system 300 generates the second audio data after encoding the audio data through the vocoder. When the second user terminal is connected to the computer terminal 310, the computer terminal 310 transmits the second audio data generated by the selective coding system 300 to the second user terminal. The second user terminal is a portable terminal having predetermined memory means, such as an MP3 player 304, a mobile communication terminal 305, or a play station 306.

상기 제2 사용자 단말기는 USB, RS-232C, 블루투스 등의 근거리 통신모듈을 통하여 상기 선택적 인코딩 시스템에 접속하고, 선택적 인코딩 시스템(300)은 상기 제2 사용자 단말기의 접속을 인식하여 상기 제2 사용자 단말기로 상기 제2 오디오 데이터를 전송한다.The second user terminal is connected to the selective encoding system through a short range communication module such as USB, RS-232C, Bluetooth, etc., and the selective encoding system 300 recognizes the connection of the second user terminal and the second user terminal. Transmit the second audio data.

본 발명의 일실시예에 따른 선택적 인코딩 시스템은 소정의 독립된 서버이고, 상기 제2 사용자 단말기는 이동통신 단말기이다. 상기 일실시예는 도 4를 참조하여 상세히 설명한다.The selective encoding system according to an embodiment of the present invention is a predetermined independent server, and the second user terminal is a mobile communication terminal. The embodiment will be described in detail with reference to FIG. 4.

도 4는 본 발명에 따른 선택적 인코딩 시스템, 서버, 및 제2 사용자 단말기를 포함하는 네트워크 구성의 다른 일례를 도시한 도면이다.4 is a diagram illustrating another example of a network configuration including a selective encoding system, a server, and a second user terminal according to the present invention.

도 4를 참조하면, 선택적 인코딩 시스템(400)은 서버(401)로부터 네트워크(402)를 통해 소정의 오디오 데이터를 수신한다. 이 때, 네트워크(402)는 유무선 통신망을 모두 포함하는 넓은 의미로 해석될 수 있다.Referring to FIG. 4, the optional encoding system 400 receives certain audio data from the server 401 via the network 402. In this case, the network 402 may be interpreted in a broad sense including both wired and wireless communication networks.

오디오 데이터를 수신한 선택적 인코딩 시스템(400)은 도 3의 실시예와 동일하게, 상기 오디오 데이터의 음성 데이터 포함 여부를 확인하고, 상기 오디오 데이터에 상기 음성 데이터가 포함된 경우 상기 오디오 데이터를 소정의 보코더를 통해 인코딩하여 제2 오디오 데이터를 생성한다. 또한, 생성된 상기 제2 오디오 데이터는 네트워크(403)를 통해 제2 사용자 단말기로 전송된다. 상기 제2 사용자 단말기 는 이동통신 단말기(404)이고, 네트워크(403)는 소정의 통신사 시스템을 포함하는 무선 통신망을 포함한다.The selective encoding system 400 receiving the audio data, as in the embodiment of FIG. 3, checks whether the audio data includes voice data, and if the audio data includes the voice data, The second audio data is generated by encoding through the vocoder. In addition, the generated second audio data is transmitted to the second user terminal through the network 403. The second user terminal is a mobile communication terminal 404, and the network 403 includes a wireless communication network including a predetermined communication company system.

즉, 선택적 인코딩 시스템(400)은 상기 통신사 시스템에 상기 이동통신 단말기(404)와의 채널설정을 요청한다. 이에, 상기 통신사 시스템은 선택적 인코딩 시스템(400)과 상기 이동통신 단말기(404)의 무선 채널을 설정하고, 선택적 인코딩 시스템(400)은 상기 무선 채널을 통해 이동통신 단말기(404)로 상기 제2 오디오 데이터를 무선 전송한다. 또한, 본 발명의 일실시예에 따른 이동통신 단말기(404)는 소정의 주기로 선택적 인코딩 시스템(400)에 전송할 제2 오디오 데이터가 존재하는지를 쿼리하고, 상기 제2 오디오 데이터가 존재하는 경우에 선택적 인코딩 시스템(400)으로 상기 제2 오디오 데이터의 전송을 요청한다.That is, the selective encoding system 400 requests the carrier system to establish a channel with the mobile communication terminal 404. Accordingly, the communication company system establishes a wireless channel between the selective encoding system 400 and the mobile communication terminal 404, and the selective encoding system 400 transmits the second audio to the mobile communication terminal 404 through the wireless channel. Send data wirelessly. In addition, the mobile communication terminal 404 according to an embodiment of the present invention queries the selective encoding system 400 whether there is a second audio data to be transmitted at a predetermined period, and selectively encodes the second audio data when the second audio data exists. The system 400 requests the transmission of the second audio data.

단계(207)에서, 상기 제2 사용자 단말기는 상기 변환정보에 따라 상기 제2 오디오 데이터를 디코딩(decoding)하여 소정의 스피커 수단을 통해 사용자로 제공한다.In step 207, the second user terminal decodes the second audio data according to the conversion information and provides it to the user through predetermined speaker means.

본 발명의 일실시예에 따른 상기 선택적 인코딩 시스템은 하나 이상의 사용자에 대한 사용자 정보를 기록한 사용자 데이터베이스를 유지한다. 상기 사용자 정보는 상기 사용자에 대응하는 상기 제2 사용자 단말기의 식별 정보를 포함하고, 상기 식별 정보의 일례로 전화번호정보가 사용될 수 있다. 즉, 상기 선택적 인코딩 시스템은 생성된 상기 제2 오디오 데이터를 상기 제2 사용자 단말기로 전송하기 위해 상기 사용자 데이터베이스를 참조하여 상기 제2 사용자 단말기에 대응하는 사용자 정보를 독출하고, 상기 사용자 정보에 대응되는 식별 정보에 따라 상기 제2 오디오 데이터를 상기 제2 사용자 단말기로 무선 전송한다. 이 때, 상기 제2 사용자 단말기는 휴대폰 등의 이동통신 단말기이다.The selective encoding system according to an embodiment of the present invention maintains a user database that records user information for one or more users. The user information may include identification information of the second user terminal corresponding to the user, and telephone number information may be used as an example of the identification information. That is, the selective encoding system reads user information corresponding to the second user terminal with reference to the user database to transmit the generated second audio data to the second user terminal, and corresponds to the user information. The second audio data is wirelessly transmitted to the second user terminal according to the identification information. In this case, the second user terminal is a mobile communication terminal such as a mobile phone.

도 5는 본 발명의 일실시예에 따른 오디오 데이터 및 제2 오디오 데이터의 데이터 포맷을 도시한 도면이다.5 is a diagram illustrating a data format of audio data and second audio data according to an embodiment of the present invention.

도 5의 식별번호(501)을 참조하면, 본 발명의 일실시예에 따른 오디오 데이터는 'A.MP3'이다. 상기 'A.MP3'는 복수의 플레이 리스트를 포함하고, 상기 선택적 인코딩 시스템은 상기 각각의 플레이 리스트를 분석하여 음성 데이터인지 여부를 확인한다. 일례로, 'A.MP3'는 라디오 방송이고, 아나운서의 나래이션 데이터 및 음악 데이터를 포함할 수 있다. 상기 선택적 인코딩 시스템은 상기 플레이 리스트의 분석결과 'A1' 및 'A3'는 음악 데이터, 'A2' 및 'A4'는 아나운서의 나래이션 데이터로 판단한다. 또한, MP3 인코더로 상기 음악 데이터로 판단된 'A1' 및 'A3'를 인코딩하고, 소정의 보코더를 이용하여 'A2' 및 'A4'를 인코딩한다. 즉, 상기 선택적 인코딩 시스템은 하나의 오디오 데이터를 각각의 플레이 리스트 별로 분석하고 분석 결과에 따라 상기 각각의 플레이 리스트에 이종의 인코딩을 수행한다. 이를 위하여 제2 사용자 단말기는 상기 플레이 리스트에 따라 각각의 리스트를 재생할 수 있는 기능을 구비해야 한다. 식별번호(501)의 경우 음성 데이터가 상당 부분을 차지하는 오디오 데이터의 경우에도 오디오 데이터의 시작 부분에 음악 또는 노래 데이터가 존재하는 경우에 상기 오디오 데이터를 음악 또는 노래 데이터로 판단될 수 있는 문제점을 방지할 수 있다.Referring to identification number 501 of FIG. 5, audio data according to an embodiment of the present invention is 'A.MP3'. The 'A.MP3' includes a plurality of playlists, and the selective encoding system analyzes the respective playlists to determine whether they are voice data. In one example, 'A.MP3' is a radio broadcast and may include narration data and music data of an announcer. The selective encoding system determines that 'A1' and 'A3' are music data and 'A2' and 'A4' are narration data of an announcer. In addition, the MP3 encoder encodes 'A1' and 'A3' determined as the music data, and encodes 'A2' and 'A4' using a predetermined vocoder. That is, the selective encoding system analyzes one audio data for each playlist and performs heterogeneous encoding on each of the playlists according to the analysis result. To this end, the second user terminal should have a function of reproducing each list according to the play list. In the case of the identification number 501, even in the case of the audio data in which the voice data occupies a considerable portion, when the music or song data exists at the beginning of the audio data, the audio data may be judged as music or song data. can do.

도 5의 식별번호(502)를 참조하면, 상기 선택적 인코딩 시스템은 식별번호 (501)에서 플레이 리스트를 삭제하고, 각각의 플레이 리스트에 인코딩과 관련된 변환정보를 삽입하여 하나의 오디오 데이터로 재 합성한다. 식별번호(502)의 경우에도 복수의 인코더를 통해 인코딩된 오디오 데이터를 디코딩할 수 있는 소정의 소프트웨어가 필요하다. 상기 소프트웨어는 주지된 관용 기술이므로 이하 상세한 설명은 생략한다.Referring to the identification number 502 of FIG. 5, the selective encoding system deletes the playlist from the identification number 501, inserts the conversion information related to encoding into each playlist, and resynthesizes it into one audio data. . The identification number 502 also requires some software capable of decoding the audio data encoded via the plurality of encoders. Since the software is a well-known conventional technique, detailed description thereof will be omitted.

도 6은 본 발명의 일실시예에 따른 선택적 인코딩 시스템의 내부 구성을 도시한 블록도이다.6 is a block diagram illustrating an internal configuration of a selective encoding system according to an embodiment of the present invention.

도 6에서 보는 바와 같이, 본 발명에 따른 선택적 인코딩 시스템(600)은 수신부(601), 변환부(602), 및 전송부(603)를 포함한다.As shown in FIG. 6, the selective encoding system 600 according to the present invention includes a receiver 601, a converter 602, and a transmitter 603.

수신부(601)는 소정의 서버로부터 오디오 데이터를 수신한다. 상기 서버는 오디오 데이터를 제공하는 일반적인 서버로서, 음성, 노래, 음악, 또는 방송 등의 오디오 데이터를 제공한다. 또한, 상기 오디오 데이터는 인코딩된 데이터 또는 가공되기 이전의 데이터를 모두 포함한다.The receiver 601 receives audio data from a predetermined server. The server is a general server for providing audio data, and provides audio data such as voice, song, music, or broadcast. The audio data also includes both encoded data or data before processing.

변환부(602)는 수신부(601)를 통해 수신한 상기 오디오 데이터의 데이터 포맷을 분석하여 음성 데이터인지 여부를 판단하고, 상기 오디오 데이터가 상기 음성 데이터를 포함하는 경우 상기 오디오 데이터를 소정의 보코더(vocoder)를 통해 인코딩하여 제2 오디오 데이터를 생성한다. 본 발명의 일실시예에 따른 변환부(602)는 상기 수신한 오디오 데이터를 소정의 플레이 리스트에 따라 분할된 복수의 데이터를 각각 음성 데이터인지 판단한다. 이에, 상기 복수의 데이터 각각에 차별된 인코딩을 수행하고, 상기 복수의 데이터는 제2 오디오로 생성된다. 이 때, 상기 제2 오디오 데이터는 보코더 및 상기 인코딩에 대한 변환정보를 포함한다.The conversion unit 602 analyzes the data format of the audio data received through the reception unit 601 to determine whether the audio data is voice data, and when the audio data includes the voice data, converts the audio data into a predetermined vocoder ( vocoder) to generate second audio data. The conversion unit 602 according to an embodiment of the present invention determines whether the received audio data is voice data, respectively, according to a predetermined play list. Accordingly, differential encoding is performed on each of the plurality of data, and the plurality of data are generated as second audio. In this case, the second audio data includes vocoder and conversion information on the encoding.

본 발명의 일실시예에 따른 변환부(602)는 사용자의 설정에 의하여 특정 인코더를 통해 오디오 데이터를 제2 오디오 데이터로 생성한다. 상기 사용자는 사용자의 취향 또는 인코딩의 오류에 따라 오디오 데이터를 특정 인코더를 통해 제2 오디오 데이터로 인코딩 되도록 설정할 수 있다. 일례로, 상기 사용자는 음악 또는 노래 데이터를 제2 사용자 단말기의 저장 용량을 고려하여, 보코더로 인코딩 되도록 설정할 수 있다.The conversion unit 602 according to an embodiment of the present invention generates the audio data as the second audio data through a specific encoder by the user's setting. The user may set the audio data to be encoded into the second audio data through a specific encoder according to a user's taste or an error in encoding. For example, the user may set the music or song data to be encoded by the vocoder in consideration of the storage capacity of the second user terminal.

전송부(603)는 생성된 상기 제2 오디오 데이터를 제2 사용자 단말기로 전송한다.The transmitter 603 transmits the generated second audio data to a second user terminal.

본 발명의 일실시예에 따른 선택적 인코딩 시스템(600)은 소정의 컴퓨터 단말기에 응용프로그램 또는 하드웨어의 형태로 포함된다. 즉, 수신부(601)는 유무선 형태의 인터넷 통신망을 통해 소정의 서버로부터 상기 오디오 데이터를 수신하고, 변환부(602)는 상기 오디오 데이터가 음성 데이터인지 여부를 판단하여 음성 데이터인 경우 상기 보코더를 통해 상기 오디오 데이터를 인코딩함으로써 제2 오디오 데이터를 생성한다. 이에, USB, RS-232C, UWB, 블루투스, 또는 무선랜 등의 근거리 통신모듈을 통하여 상기 제2 사용자 단말기가 접속되는 경우에 전송부(603)는 상기 제2 오디오 데이터를 상기 제2 사용자 단말기로 전송한다. Selective encoding system 600 according to an embodiment of the present invention is included in the form of an application program or hardware in a predetermined computer terminal. That is, the receiver 601 receives the audio data from a predetermined server through a wired / wireless internet communication network, and the converter 602 determines whether the audio data is voice data, and if it is voice data, through the vocoder. The second audio data is generated by encoding the audio data. Accordingly, when the second user terminal is connected through a short range communication module such as USB, RS-232C, UWB, Bluetooth, or wireless LAN, the transmitter 603 transfers the second audio data to the second user terminal. send.

본 발명의 다른 일실시예에 따른 선택적 인코딩 시스템(600)은 소정의 독립된 서버이다. 이에, 수신부(601)는 상기 서버로부터 유무선 형태의 통신망을 통해 상기 서버로부터 상기 오디오 데이터를 수신하고, 변환부(602)는 상기 오디오 데이 터가 음성 데이터인지 여부를 판단하여 제2 오디오 데이터를 생성한다. 이에, 전송부(603)는 상기 제2 오디오 데이터를 상기 제2 사용자 단말기로 무선 전송한다. 상기 제2 사용자 단말기는 소정의 통신 단말기로서 이동 통신 단말기, PSTN 단말기, VoIP, SIP, Megaco, PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, 핸드 헬드 PC(Hand-Held PC), CDMA-2000(1X, 3X)폰, WCDMA(Wideband CDMA)폰, 듀얼 밴드/듀얼 모드(Dual Band/Dual Mode)폰, GSM(Global Standard for Mobile)폰, MBS(Mobile Broadband System)폰, 또는 위성/지상파 DMB(Digital Multimedia Broadcasting)폰 등을 포함한다.Optional encoding system 600 according to another embodiment of the present invention is a predetermined independent server. Accordingly, the receiver 601 receives the audio data from the server through a wired / wireless communication network from the server, and the converter 602 determines whether the audio data is voice data to generate second audio data. do. Accordingly, the transmitter 603 wirelessly transmits the second audio data to the second user terminal. The second user terminal is a predetermined communication terminal as a mobile communication terminal, PSTN terminal, VoIP, SIP, Megaco, PDA (Personal Digital Assistant), cellular phone, PCS (Personal Communication Service) phone, hand-held PC ), CDMA-2000 (1X, 3X) phones, WCDMA (Wideband CDMA) phones, Dual Band / Dual Mode phones, Global Standard for Mobile (GSM) phones, Mobile Broadband System (MBS) phones, Or satellite / terrestrial digital multimedia broadcasting (DMB) phones.

본 발명의 일실시예에 따른 선택적 인코딩 시스템(600)은 사용자 데이터베이스(604) 및 데이터베이스 관리부(605)를 더 포함한다.The optional encoding system 600 according to an embodiment of the present invention further includes a user database 604 and a database manager 605.

사용자 데이터베이스(604)는 하나 이상의 사용자에 대한 사용자 정보를 유지한다. 상기 사용자 정보는 상기 사용자에 대응하는 상기 제2 사용자 단말기의 식별 정보를 포함한다. 또한, 데이터베이스 관리부(605)는 사용자 데이터베이스(604)를 참조하여 상기 제2 사용자 단말기에 대응하는 사용자 정보를 독출하고, 전송부(603)를 제어하여 상기 사용자 정보에 대응되는 식별 정보로 상기 제2 오디오 데이터를 상기 제2 사용자 단말기로 무선 전송한다.User database 604 maintains user information for one or more users. The user information includes identification information of the second user terminal corresponding to the user. In addition, the database manager 605 reads user information corresponding to the second user terminal with reference to the user database 604, and controls the transmission unit 603 to identify the second information as identification information corresponding to the user information. Wirelessly transmit audio data to the second user terminal.

일례로, 전송부(603)는 상기 제2 사용자 단말기로 상기 제2 오디오 데이터를 무선 전송하기 위하여, 사용자 데이터베이스(604)를 파싱하고, 소정의 사용자 정보를 독출한다. 상기 사용자 정보는 상기 제2 사용자 단말기의 전화번호정보 등의 식별 정보를 포함하며, 전송부(603)는 상기 전화번호정보 등의 식별 정보에 따라 제2 사용자 단말기로 상기 제2 오디오 데이터를 전송한다.For example, the transmitter 603 parses a user database 604 and reads predetermined user information in order to wirelessly transmit the second audio data to the second user terminal. The user information includes identification information such as telephone number information of the second user terminal, and the transmission unit 603 transmits the second audio data to the second user terminal according to the identification information such as the telephone number information. .

도 7은 본 발명에 따른 선택적 인코딩 방법을 수행하는데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.7 is an internal block diagram of a general purpose computer device that may be employed to perform the selective encoding method according to the present invention.

컴퓨터 장치(700)는 램(RAM: Random Access Memory)(720)과 롬(ROM: Read Only Memory)(730)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(710)를 포함 한다. 프로세서(710)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려져 있는 바와 같이, 롬(730)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전송하는 역할을 하며, 램(720)은 통상적으로 데이터와 명령을 양방향성으로 전송하는 데 사용된다. 램(720) 및 롬(730)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(740)는 양방향성으로 프로세서(710)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(740)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD 롬(760)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(710)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(750)와 연결된다. 마지막으로, 프로세서(710)는 네트워크 인터페이스(770)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차 를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당 업자에게 잘 알려져 있다.Computer device 700 includes one or more processors 710 connected to a main memory including random access memory (RAM) 720 and read only memory (ROM) 730. The processor 710 is also called a central processing unit (CPU). As is well known in the art, the ROM 730 serves to transfer data and instructions to the CPU unidirectionally, and the RAM 720 typically transfers data and instructions bidirectionally. Used to. RAM 720 and ROM 730 may include any suitable form of computer readable media. Mass storage 740 is bidirectionally coupled to processor 710 to provide additional data storage capabilities, and may be any of the computer readable recording media described above. The mass storage device 740 is used to store programs, data, and the like, and is typically an auxiliary memory device such as a hard disk which is slower than the main memory device. Certain mass storage devices such as CD ROM 760 may be used. The processor 710 may include one or more input / output interfaces, such as video monitors, trackballs, mice, keyboards, microphones, touchscreen displays, card readers, magnetic or paper tape readers, voice or handwriting readers, joysticks, or other known computer input / output devices. 750 is connected. Finally, the processor 710 may be connected to a wired or wireless communication network through the network interface 770. Through this network connection, the procedure of the method described above can be performed. The devices and tools described above are well known to those skilled in the computer hardware and software arts.

상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention.

지금까지 본 발명에 따른 구체적인 실시예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능함은 물론이다.While specific embodiments of the present invention have been described so far, various modifications are possible without departing from the scope of the present invention.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be defined not only by the scope of the following claims, but also by those equivalent to the scope of the claims.

본 발명에 따르면, 오디오 데이터를 기록하는 휴대용 단말기의 메모리 수단에 대한 효율을 증가시킬 수 있다.According to the present invention, the efficiency with respect to the memory means of the portable terminal for recording audio data can be increased.

본 발명에 따르면, 선택적 인코딩 시스템에서 오디오 데이터를 데이터의 특성에 따라 인코딩하여 무선 통신망을 통해 제2 사용자 단말기로 전송함으로써, 상기 무선 통신망에 발생되는 부하를 줄일 수 있다.According to the present invention, in the selective encoding system, the audio data is encoded according to the characteristics of the data and transmitted to the second user terminal through the wireless communication network, thereby reducing the load generated on the wireless communication network.

Claims (9)

선택적 인코딩 시스템의 동작 방법에 있어서,In the operating method of the selective encoding system, 소정의 서버로부터 수신한 제1 오디오 데이터의 데이터 포맷을 분석하여, 상기 제1 오디오 데이터에 음성 데이터가 포함되는지를 판단하는 단계; 및Analyzing a data format of first audio data received from a predetermined server to determine whether voice data is included in the first audio data; And 상기 판단 결과 상기 제1 오디오 데이터에 음성 데이터가 포함되는 경우, 상기 제1 오디오 데이터를 소정의 보코더(vocoder)를 통해 인코딩하여 제2 오디오 데이터를 생성하는 단계; 또는If the first audio data includes voice data as a result of the determination, generating second audio data by encoding the first audio data through a predetermined vocoder; or 상기 판단 결과 상기 제1 오디오 데이터에 음성 데이터가 포함되지 않는 경우, 상기 제1 오디오 데이터를 사용자 단말기로 전송하는 단계를 포함하고,If the voice data is not included in the first audio data as a result of the determination, transmitting the first audio data to a user terminal; 제2 오디오 데이터를 생성하는 상기 단계는,The step of generating the second audio data, 상기 보코더 및 상기 인코딩에 대한 변환정보를 포함하는 상기 제2 오디오 데이터를 생성하는 단계; 및Generating the second audio data including the vocoder and transform information for the encoding; And 사용자 단말기에서 상기 변환정보에 따라 상기 제2 오디오 데이터가 디코딩되도록, 상기 생성된 제2 오디오 데이터를 상기 사용자 단말기로 전송하는 단계Transmitting the generated second audio data to the user terminal such that the second audio data is decoded according to the conversion information at the user terminal. 를 포함하는 것을 특징으로 하는 오디오 데이터의 선택적 인코딩 방법.Selective encoding method of the audio data comprising a. 제1항에 있어서,The method of claim 1, 제2 오디오 데이터를 상기 사용자 단말기로 전송하는 상기 단계는,The transmitting of the second audio data to the user terminal may include: 상기 사용자 단말기가 접속되는 경우, 상기 사용자 단말기로 상기 제2 오디오 데이터를 전송하는 단계When the user terminal is connected, transmitting the second audio data to the user terminal. 를 포함하는 것을 특징으로 하는 선택적 인코딩 방법.Optional encoding method comprising a. 제1항에 있어서,The method of claim 1, 상기 사용자 단말기의 식별 정보에 관한 사용자 정보를 기록한 사용자 데이터베이스를 유지하는 단계를 더 포함하고,Maintaining a user database in which user information on identification information of the user terminal is recorded; 제2 오디오 데이터를 상기 사용자 단말기로 전송하는 상기 단계는,The transmitting of the second audio data to the user terminal may include: 상기 사용자 데이터베이스를 참조하여 상기 사용자 단말기와 연관되는 사용자 정보를 독출하는 단계; 및Reading user information associated with the user terminal by referring to the user database; And 상기 독출한 사용자 정보의 식별 정보에 따라 상기 제2 오디오 데이터를 상기 사용자 단말기로 무선 전송하는 단계Wirelessly transmitting the second audio data to the user terminal according to the identification information of the read user information; 를 포함하는 것을 특징으로 하는 선택적 인코딩 방법.Optional encoding method comprising a. 제1항에 있어서,The method of claim 1, 상기 보코더(vocoder)는,The vocoder is, QCELP(Qualcomm Code Excited Linear Prediction), EVRC(Enhanced Voice Rated Codec), 또는 AMR(Adaptive Multi-Rate) 중에서 적어도 하나를 포함하는 것을 특징으로 하는 선택적 인코딩 방법.Selective encoding method comprising at least one of Qualcomm Code Excited Linear Prediction (QCELP), Enhanced Voice Rated Codec (EVRC), or Adaptive Multi-Rate (AMR). 제1항에 있어서,The method of claim 1, 상기 제1 오디오 데이터는 상기 서버로부터 RSS(Rich Site Summary) 방식으로 수신하는 것을 특징으로 하는 선택적 인코딩 방법.And the first audio data is received from the server in a Rich Site Summary (RSS) manner. 삭제delete 제1항 내지 제5항 중 어느 하나의 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.A computer-readable recording medium having recorded thereon a program for executing the method of any one of claims 1 to 5. 선택적 인코딩 시스템에 있어서,In an optional encoding system, (1) 소정의 서버로부터 수신한 제1 오디오 데이터의 데이터 포맷을 분석하여, 상기 제1 오디오 데이터에 음성 데이터가 포함되는지를 판단하고,(1) analyzing the data format of the first audio data received from the predetermined server to determine whether the audio data is included in the first audio data, (2-1) 상기 판단 결과 상기 제1 오디오 데이터에 음성 데이터가 포함되는 경우, 상기 제1 오디오 데이터를 소정의 보코더를 통해 인코딩하여 제2 오디오 데이터를 생성하거나, 또는,(2-1) when the first audio data includes voice data as a result of the determination, second audio data is generated by encoding the first audio data through a predetermined vocoder; or (2-2) 상기 판단 결과 상기 제1 오디오 데이터에 음성 데이터가 포함되지 않는 경우, 상기 제1 오디오 데이터가 전송부에 의해 사용자 단말기로 전송되도록 하는 변환부를 포함하고,(2-2) a conversion unit for transmitting the first audio data to the user terminal by the transmitter if the first audio data does not include voice data as a result of the determination; 상기 변환부는, 상기 (2-1)에서, 상기 보코더 및 상기 인코딩에 대한 변환정보를 포함하는 상기 제2 오디오 데이터를 생성하고, 사용자 단말기에서 상기 변환정보에 따라 상기 제2 오디오 데이터가 디코딩되도록, 상기 생성된 제2 오디오 데이터가 상기 전송부에 의해 사용자 단말기로 전송되도록 하는 것을 특징으로 하는 선택적 인코딩 시스템.The converting unit generates the second audio data including the vocoder and the conversion information about the encoding in (2-1), and decodes the second audio data according to the conversion information in a user terminal. And wherein the generated second audio data is transmitted to the user terminal by the transmitter. 제8항에 있어서,The method of claim 8, 사용자 단말기의 식별 정보에 관한 사용자 정보를 기록한 사용자 데이터베이스; 및A user database that records user information about identification information of the user terminal; And 상기 사용자 데이터베이스를 참조하여 상기 사용자 단말기와 연관되는 사용자 정보를 독출하고, 상기 전송부를 제어하여 상기 독출한 사용자 정보의 식별 정보에 따라 상기 제2 오디오 데이터를 사용자 단말기로 무선 전송되도록 하는 데이터베이스 관리부A database manager that reads user information associated with the user terminal by referring to the user database, and controls the transmitter to wirelessly transmit the second audio data to the user terminal according to identification information of the read user information; 를 더 포함하는 것을 특징으로 하는 선택적 인코딩 시스템.Optional encoding system further comprises.
KR1020050091846A 2005-09-30 2005-09-30 Optional encoding system and method for operating the system KR100757858B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020050091846A KR100757858B1 (en) 2005-09-30 2005-09-30 Optional encoding system and method for operating the system
PCT/KR2006/003903 WO2007037641A1 (en) 2005-09-30 2006-09-28 Optional encoding system and method for operating the system
CN2006800359075A CN101273405B (en) 2005-09-30 2006-09-28 Optional encoding system and method for operating the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050091846A KR100757858B1 (en) 2005-09-30 2005-09-30 Optional encoding system and method for operating the system

Publications (2)

Publication Number Publication Date
KR20070036870A KR20070036870A (en) 2007-04-04
KR100757858B1 true KR100757858B1 (en) 2007-09-11

Family

ID=37900009

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050091846A KR100757858B1 (en) 2005-09-30 2005-09-30 Optional encoding system and method for operating the system

Country Status (3)

Country Link
KR (1) KR100757858B1 (en)
CN (1) CN101273405B (en)
WO (1) WO2007037641A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967735A (en) * 2021-02-23 2021-06-15 北京达佳互联信息技术有限公司 Training method of voice quality detection model and voice quality detection method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030057494A (en) * 2003-01-16 2003-07-04 (주)유토포스 The advanced digital audio contents service system and its implementation method for mobile wireless device on wireless and wired internet communication network
KR20040066000A (en) * 2003-01-16 2004-07-23 (주)유토포스 The advanced digital audio contents service system and its implementation method for mobile wireless device on wireless and wired internet communication network
KR20060027246A (en) * 2004-09-22 2006-03-27 (주)믹스크리에이티브 The digital audio streaming service system and its implementation method for non-mpeg4 mobile handsets on wireless communication network

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69232112T2 (en) * 1991-11-12 2002-03-14 Fujitsu Ltd Speech synthesis device
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US6505153B1 (en) * 2000-05-22 2003-01-07 Compaq Information Technologies Group, L.P. Efficient method for producing off-line closed captions
KR100754439B1 (en) * 2003-01-09 2007-08-31 와이더댄 주식회사 Preprocessing of Digital Audio data for Improving Perceptual Sound Quality on a Mobile Phone

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030057494A (en) * 2003-01-16 2003-07-04 (주)유토포스 The advanced digital audio contents service system and its implementation method for mobile wireless device on wireless and wired internet communication network
KR20040066000A (en) * 2003-01-16 2004-07-23 (주)유토포스 The advanced digital audio contents service system and its implementation method for mobile wireless device on wireless and wired internet communication network
KR20060027246A (en) * 2004-09-22 2006-03-27 (주)믹스크리에이티브 The digital audio streaming service system and its implementation method for non-mpeg4 mobile handsets on wireless communication network

Also Published As

Publication number Publication date
CN101273405A (en) 2008-09-24
CN101273405B (en) 2011-12-21
KR20070036870A (en) 2007-04-04
WO2007037641A1 (en) 2007-04-05

Similar Documents

Publication Publication Date Title
JP6728456B2 (en) Adaptive processing by multiple media processing nodes
US9218820B2 (en) Audio fingerprint differences for end-to-end quality of experience measurement
RU2418323C2 (en) Systems and methods of changing window with frame, associated with audio signal
JP4724452B2 (en) Digital media general-purpose basic stream
US20070112571A1 (en) Speech recognition at a mobile terminal
US9111531B2 (en) Multiple coding mode signal classification
KR101160218B1 (en) Device and Method for transmitting a sequence of data packets and Decoder and Device for decoding a sequence of data packets
CN103109321B (en) Estimating a pitch lag
WO2020037810A1 (en) Bluetooth-based audio transmission method and system, audio playing device and computer-readable storage medium
KR101699138B1 (en) Devices for redundant frame coding and decoding
CA2792898C (en) Adaptive audio transcoding
US7447639B2 (en) System and method for error concealment in digital audio transmission
KR101548846B1 (en) Devices for adaptively encoding and decoding a watermarked signal
TWI459377B (en) Electronic device, apparatus, method and computer program product for coding and decoding a transient frame
US10733996B2 (en) User authentication
JP2003524939A (en) Method and apparatus for providing feedback from a decoder to an encoder to improve the performance of a predictive speech coder under frame erasure conditions
US9767822B2 (en) Devices for encoding and decoding a watermarked signal
US20100104267A1 (en) System and method for playing media file
KR100757858B1 (en) Optional encoding system and method for operating the system
US11087778B2 (en) Speech-to-text conversion based on quality metric
US9437211B1 (en) Adaptive delay for enhanced speech processing
KR100428717B1 (en) Speech signal transmission method on data channel
KR100657818B1 (en) Method for playing multimedia data including codec
US20080215342A1 (en) System and method for enhancing perceptual quality of low bit rate compressed audio data
US20080172139A1 (en) System and method for enhancing perceptual quality of low bit rate compressed audio data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120904

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130902

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140829

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150827

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160830

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee