KR940001861B1 - 오디오 대역신호의 음성/음악 판별장치 - Google Patents

오디오 대역신호의 음성/음악 판별장치 Download PDF

Info

Publication number
KR940001861B1
KR940001861B1 KR1019910005856A KR910005856A KR940001861B1 KR 940001861 B1 KR940001861 B1 KR 940001861B1 KR 1019910005856 A KR1019910005856 A KR 1019910005856A KR 910005856 A KR910005856 A KR 910005856A KR 940001861 B1 KR940001861 B1 KR 940001861B1
Authority
KR
South Korea
Prior art keywords
signal
music
voice
band
audio
Prior art date
Application number
KR1019910005856A
Other languages
English (en)
Other versions
KR920020865A (ko
Inventor
윤상락
Original Assignee
삼성전자 주식회사
강진구
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사, 강진구 filed Critical 삼성전자 주식회사
Priority to KR1019910005856A priority Critical patent/KR940001861B1/ko
Priority to US07/802,042 priority patent/US5298674A/en
Priority to JP33224791A priority patent/JP3156975B2/ja
Publication of KR920020865A publication Critical patent/KR920020865A/ko
Application granted granted Critical
Publication of KR940001861B1 publication Critical patent/KR940001861B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/046Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/265Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
    • G10H2210/295Spatial effects, musical uses of multiple audio channels, e.g. stereo
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S84/00Music
    • Y10S84/09Filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

내용 없음.

Description

오디오 대역신호의 음성/음악 판별장치
제1도는 본 발명에 따른 블록 구성도.
제2도는 제1도의 실시예에 대한 블록 구성도.
제3도는 제2도중 전치 처리부의 구성도.
제4도는 제2도중 스테레오 검출부의 구성도.
제5도는 제2도중 고저 검출부의 구성도.
제6도는 제2도중 단속 검출부의 구성도.
제7도는 제2도중 피크변동 검출부의 구성도.
제8도는 제2도중 종합판단부의 구성도.
제9도는 제2도중 A/V가공부의 구성도.
* 도면의 주요부분에 대한 부호의 설명
100 : 전치처리부 200 : 스테레오 검출부
300 : 고저검출부 400 : 단속검출부
500 : 피크변동 검출부 600 : 종합판단부
700 : A/V가공부 800 : 입력버퍼
900 : 출력버퍼
본 발명은 오디오 신호 판별장치에 관한 것으로, 특히 오디오 대역의 신호를 수신하여 자동적으로 음악 또는 음성신호로 판별할 수 있는 장치에 관한 것이다.
일반적으로 수신되는 오디오 대역 신호의 특성을 판단하기 위해서는 아날로그 형태의 오디오 신호를 디지털 형태로 변환한 후, 디지털 오디오 신호의 특성을 인식하는 과정을 수행하여야 한다. 즉, 수신되는 오디오 신호가 음성 또는 음악인가를 판단하고자 하는 경우, 먼저 오디오 신호를 디지털 변환하고, 해당 디지털 신호의 특성을 분석한 후, 이를 다시 음성 또는 음악으로 인식하여 처리하여야 하였다. 그러나 상기와 같은 식별 방식은 고가의 인공지능 식별장치를 이용하여야 했으며, 처리방식 또한 매우 복잡하였다.
현재 영상 또는 음향 매체의 발달에 따라 영상 음악이 보편화되어 가는 추세이다. 이때 소형 영상 시스템(CATV, VDP)등과 음향장치를 채택하고 있는 시스템 등에서는 오디오 신호의 재생 능력의 한계가 있게 된다. 즉, 상기와 같은 소형 시스템에서는 오디오 대역 신호에 존재하는 음성 및 음의 신호의 재생 처리를 동일하게 처리함으로서, 영상음악 또는 음악 청취시에 박진감이 없게 된다. 그러므로 상기 소형 시스템에서 오디오 대역 신호가 음성인 경우에는 다이내믹 레인지 대역을 그대로 출력하고, 음악인 경우에는 해당 다이내믹 레인지에서 저역 및 고역의 신호를 부스트시키면, 음악신호를 박력있게 재생할 수 있게 된다.
상기와 같은 경우, 시스템은 수신되는 오디오 신호를 식별하여 수신 오디오 신호가 음성인가 또는 음악인가를 판단한 후, 판단 신호를 근거로 해서 수신 오디오 신호의 재생 처리를 수행해야 한다. 그러나 상기와 같은 소형 시스템이 수신 오디오 신호의 음성 또는 음악성분을 식별하기 위해서 고가의 디지털 처리 기능을 갖는 경우 시스템의 가격이 상승되며, 또한 구현기술 자체가 복잡하여 시스템의 부피가 커지는 문제점을 갖게 된다.
따라서 본 발명의 목적은 오디오 처리 시스템에서 수신되는 오디오 대역 신호를 식별하여 음성 및 음악으로 판별할 수 있는 장치를 제공함에 있다.
본 발명의 다른 목적은 수신되는 오디오 신호를 음성 및 음악의 고유 특성에 따라 다수개의 판단 유니트를 통해 식별하여, 수신 오디오 신호를 음성 또는 음악으로 판별할 수 있는 장치를 제공함에 있다.
본 발명의 또 다른 목적으로 수신 오디오 신호를 음성 또는 음악으로 판단하고자 하는 경우, 음성 및 음악의 특성을 아날로그 형태로 식별할 수 있는 판별장치를 제공함에 있다.
본 발명의 또 다른 목적은 오디오 처리 시스템에서 수신되는 오디오 대역 신호를 식별하여 음성 및 음악으로 판단하고, 음악으로 판단될 시 해당 다이내믹 레인지에서 저역 및 고역의 신호를 부스트시켜 음악신호를 박력있게 재생할 수 있는 장치를 제공함에 있다.
이하 본 발명을 도면을 참조하여 상세히 설명한다.
오디오 신호를 음성 또는 음악으로 판별할시, 복잡하지 않고 만족하게 정당율을 얻기 위한 장치는 완전한 판별논리를 억제하고 경험치적인 전기 파라메터를 기초로 하여 판별할 수 있도록 구성한다. 다시 말해서, 지금 해결하기 위한 문제를 계수 f라고 하고, x(t)를 입력시호라고 하면, 오차계수 e(f)는 하기와 같이 정의할 수 있다.
Figure kpo00001
상기 식에서, e는 순간 오차율로서 "e=1 -순간시간 정당율"이 된다. 또한 상기 식에서, δ은 인수가 같을 때 1을 갖는 δ계수이고, g는 입력신호 x(t)가 인간의 음성으로 판단되는 경우에 "음성"으로 되며, 음악이라고 판단한 경우 음악으로 되는 계수에서 값의 대역은 f와 같다.
상기와 같은 경우, 종래의 판별 장치에서는 상기 계수를 실현하기 위하여 인공지능이나 또는 뉴런 네트워크(neuron network)를 이용하여야만 했다. 이는 계수 g의 값 범위의 불확실성이 존재하기 때문에 상기 계수 f의 기술이 곤란했기 때문이다.
따라서 본 발명에서는 상기 계수 f를 하기와 같이 실현한다.
Figure kpo00002
여기서 f1, f2, f3, ..., fn은 입력신호 x(t)가 가진 고유특성의 파라메터로서, 음악 또는 음성인가를 판단하는 계수이다. 상기 식의 표현은 미분형태에서 편미분 형태로 값을 변환할 수 있다. 이때 많은 경우에서 미분은 편미분의 선형 일차 결합으로 나타낼 수 있지만, 상기 계수 f는 인수에 대하여 반드시 선형에서 필요한 것은 아니다. 다만 f가 비선형 계수의 경우에는 해석 및 조정이 복잡하므로, 상기 계수 f는 선형일차 결합으로 간략화하는 것도 타당하다.
상기 입력 오디오 신호 x(t)를 음성 및 음악 신호로 판단하는 본 발명의 장치는 상기 음성/음악판별 장치가 간단한 회로 구성을 갖도록 하며, 이로 인해 나중에 판단 결과 하의 최적값 설정도 간단해지게 된다. 그러므로 상기 계수 f를 f1, f2, f3, ..., fn을 선형 일차 결합으로 나타내면 하기와 같다.
Figure kpo00003
상기 식에서, a1, a2, a3, ..., an은 실수이므로, f1, f2, f3, ..., fn 및 f의 값은 음악을 "1", 음성을 "0"으로 하고, 이때의 상기 계수 f의 값들은 정규화한 "0"에서 "1"까지의 실수 값을 갖는다.
따라서 상기 계수 f의 값을 정규화한 실수로 나타낼 수 있으므로, 상기한 계수 g의 불확실성도 표시할 수 있다. 여기서 f1, f2, f3, ..., 루은 입력 오디오 신호 x(t)의 파라메터이므로, 상기 음성/음악판별 장치를 각각의 고유 특성에 대응되는 파라메터를 검출할 수 있는 n개의 판단유니트를 구비하고, 또한 n개의 판단유니트들을 통해 출력되는 판단 결과 신호 f1, f2, f3, ..., fn을 종합적으로 분석하여 수신된 오디오 신호를 최종적으로 음악 또는 음성신호로 판단하는 종합판단부를 구비하게 된다.
다음으로 순차 오차율 e를 극소화하기 위하여, 판단유니트의 개수 n은 많으면 많을수록 좋다는 것을 알 수 있다. 또한 각각의 판단유니트를 사용하는 파라메터는 독립적으로 구현하는 것이 좋다. 그리고 상기 각 판단유니트들의 출력 fx들과 종합판단부의 출력 f를 구성한 후, 선형결합 계수 a1, a2, a3, ..., an은 간단하게 최적 설정치로 하는 것이 가능하다. 각각의 판단유니트들을 출력하는 fx들은 입력 오디오 신호 x(t)의 해당 파라메터만을 판단할 수 있기 때문에, 해당 파라메터의 순간 시간 오차율 e(fa)는 대단히 높은 것으로 생각될 수 있다. 그러나 각 판단유니트를 잠깐동안 동작시켜 순간 시간 오차율 e(fx)를 최소로 할 수 있는 선형결합 계수 a1, a2, a3, ..., an의 용량을 계산할 수 있다.
제1도는 상기와 같은 본 발명을 구현하기 위한 블록 구성도로서, 전치 처리부(10)는 수신되는 오디오 신호 x(t)를 음성 및 음악대역으로 구분하여 다수개로 구성되는 판단부(20)로 출력한다. 상기 판단부(20)는 수신 오디오 신호 x(t)의 고유특성에 따른 파라메터를 검출하기 위한 다수개의 판단유니트를 가지며, 각 판단유니트는 상기 오디오 신호 x(t)의 파라메터를 각각 독립적으로 검출하여 종합판단부(30)로 출력한다. 상기 종합판단부(30)는 상기 판단부(20)를 출력하는 다수개의 판단결과 신호를 수신하여 수신 오디오 신호를 음성 또는 음악신호로 종합판단 함으로서, 최적 조건으로 오차율 및 부적당한 판정을 최소화하고 정확하고 타당성 있는 판별신호를 출력한다.
상기 구성에 의한 동작을 살펴보면, 먼저 오디오 대역 신호를 음성 및 음악이 표면적으로 다른 특성에 따라 다수개의 파라메터로 나눈다. 그리고 상기 판단부(2)는 상기 각각의 파라메터에 1 : 1로 대응되는 판단유니트들을 구비하여 독립적으로 오디오 신호의 고유 특성들에 대한 파라메터들을 검출한다. 따라서 상기 각 판단유니트들은 수신되는 오디오 신호 x(t)에서 해당 파라메터 성분의 유무에 따라 음성 또는 음악으로 판단하게 되며, 이들은 상기 판단부(20)내에 구성된다.
이를 위하여, 상기 전치 처리부(10)는 상기 수신되는 오디오 신호를 상기 각 판단유니트들로 적절하게 인가될 수 있도록 오디오 신호를 변화한다. 즉, 상기 전치 처리부(10)는 수신되는 오디오 신호 x(t)를 음성 및 음악 대역으로 구분하여 출력시킨다. 그러면 상기 판단부(20)의 각 판단유니트들은 상기 전치 처리부(10)의 출력을 수신한 후, 해당 파라메터 특성을 분석하여 수신 오디오 신호가 음성인가 또는 음악인가를 판단한다. 이때 상기 각각의 판단유니트는 기본적으로 하나의 파라메터밖에 처리하지 않기 때문에 잘못된 판단 결과를 발생할 수 있다.
상기 판단부(20)의 각 판단 유니트들의 파라메터 출력을 수신하는 종합판단부(30)는 상기 파라메터 출력들을 동시에 수신하고, 수신된 각 파라메터 출력들을 종합 분석하여 경험치적인 계산 또는 통계적 최적 설정값에 따라 수신 오디오 신호가 음악인가 또는 음성인가를 판단한다. 따라서 상기 종합판단부(30)는 상기 다수개의 판단유니트들 중에서 일부가 잘못된 판단결과 신호를 출력하더라도, 히스테리시스성 및 다수결 결정성에 의한 아날로그 계산을 수행하여 종합적으로는 식별율이 높은 음성 또는 음악판별 신호를 출력할 수 있다. 본 발명에서 상기 판단부(20)는 수신 오디오 신호가 스테레오 성분을 갖는가를 판단하는 유니트, 수신 오디오 신호의 고음 및 저음의 강약 유무를 판단하는 유니트, 수신 오디오 신호의 강도가 단독 또는 연속적인가를 판단하는 유니트 및 수신 오디오 신호의 대역폭을 검출하여 스펙트럼상의 피크주파수 변동을 판단유니트들을 독립적으로 구성할 수 있다.
제2도는 상기와 같은 판단 유니트들을 이용하여 수신되는 오디오 신호를 음악 또는 음성신호로 판정하고, 이 판정신호에 의해 오디오 신호의 재생 특성을 변형하는 본 발명의 실시예 구성도이다.
상기 제2도의 구성을 살펴보면, 먼저 입력버퍼(800)는 수신되는 오디오 신호를 증폭 출력한다. 상기 입력버퍼(800)를 출력하는 오디오 신호를 수신하는 전치 처리부(100)는 수신 오디오 신호를 음성 및 음악 대역으로 각각 검출하고, 검출 신호에 따라 수신 오디오 신호를 음성 대역의 제1처리신호 및 음악 대역의 제2처리 신호로 분리 출력한다.
스테레오 검출부(200)는 상기 입력 버퍼(800)를 출력하는 오디오 신호의 좌측 채널신호(이하 "L신호"라 칭함)와 우측 채널신호(이하 "R신호"라 칭함)를 수신하고, 두신호의 차신호를 계산한 후, 상기 차신호의 레벨에 따라 수신 오디오 신호가 스테레오인가 또는 모노인가를 판단하여 제1판단신호 S/MD를 발생한다. 즉, 수신 오디오 신호가 스테레오인 경우로 가정하면 스테레오 성분을 갖는 오디오 신호 대역에서 음성신호는 L채널 및 R채널에 동일하게 실리게 되므로, 상기 음성신호는 결국 모노에 가까운 출력이 발생된다. 그러나 음성신호는 L채널과 R채널에 상이하게 실리게 되므로 두 채널의 차신호가 발생되며, 이차신호가 크게 발생되면 음악 신호로 판별할 수 있게 된다. 따라서 스테레오 형태의 오디오 신호가 수신되는 경우, 두 신호의 차신호를 검출하고, 상기 차신호의 크기로서 수신 오디오 신호가 음성 또는 음악인가를 판단할 수 있다. 그러나 수신 오디오 신호가 모노인 경우, 음악 성분에 대해서는 완전한 효과가 나타나지 않게 되므로, 상기 스테레오 검출부(200)를 동작시키지 않아야 한다. 또한 텔레비젼에 상기 스테레오 검출부(200)를 용융하는 경우에는 캐리어 신호에 스테레오/모노 ID 및 음성다중 ID를 포함하고 있으므로, 이 신호를 이용하여 스위칭시키면 된다.
고저 검출부(300)는 상기 전치 처리부(100)를 출력하는 상기 제1 및 제2처리신호를 수신하여, 상기 제1 및 제2처리신호의 절대값을 취한 후, 두 절대값의 차신호를 분석하여 저음과 고음의 강약유무에 따라 제2판단신호 H/LD를 발생한다. 즉, 인간의 음성이 결정된 중음 대역내의 스펙트럼 값에 갖지 않는 것에 비해, 음악은 넓은 대역의 스펙트럼의 음을 갖게 되므로, 고음 및 저음 영역에서 음악은 음성보다 상대적으로 강한 홈을 갖게 된다. 따라서 측정하고자 하는 오디오 신호를 고역, 중역 및 저역으로 여파하여 이들의 엔벨로프 특성을 분석하면, 수신 오디오 신호가 음성인가 또는 음악인가를 판단할 수 있다. 그러나 단순하게 고음 및 저음과 일정량을 비교하는 경우에는 오디오 신호의 입력 레벨에 영향을 주기 때문에, 상기 고저 검출부(300)는 고음 및 저음 검출시 이를 중음에 비교함으로서 입력 레벨의 영향을 방지할 수 있다.
단속 검출부(400)는 상기 전치 처리부(100)의 제1처리신호를 수신하여 적분한 후, 엔벨로프의 단속 또는 연속성을 검사하여 제3판단신호 ITD를 발생한다. 즉, 음성의 경우에는 엔벨로프의 연속성이 크고, 음악인 경우에는 엔벨로프의 연속성이 작게 된다. 따라서 상기 제1처리신호의 절대치를 두 개의 시정수를 갖는 다른 적분회로를 통해 구한 후, 이들 신호차를 구하면 이 신호차는 엔벨로프의 미분으로 된다. 이때 상기 값의 평균 시간이 크면 음성이라고 할 수 있다. 그러므로 음성 범위이면 상기 단속검출부(400)는 음성식별률이 상당히 양호하게 된다.
피크변동 검출부(500)는 상기 전치 처리부(100)를 출력하는 제2처리신호를 수신하여 대역폭을 검출한 후, 검출한 대역폭내에서 피크부파수의 변동을 판단하여 제4판단신호 PVD를 발생한다. 즉, 음악성분이 고음과 저음이 음성 성분에 비해 강하다는 것은 음악 성분으 대역폭이 넓다는 의미로 해석할 수 있다. 따라서 대역폭이 넓다는 것은 수신 오디오 신호가 음악이라고 할 수 있다. 또한 음악은 대역폭내에서 피크 주파수의 변동이 크다. 이는 상대적으로 음성신호의 피크 주파수 변동이 작음을 의미한다. 따라서 상기 피크변동검출부(500)는 넓은 대역폭을 가지며 피크 주파수의 변동이 크면 음악 신호로 판단하고, 좁은 대역폭을 가지며 피크 주파수의 변동이 없으면 음성신호로 판단한다.
종합판단부(600)는 상기 제1-제4판단신호 S/MD, H/LD, ITD, PVD를 수신하여 종합판단한 후 최종적으로 수신 오디오 신호가 음악인가 또는 음성인가를 판단하는 신호 V/MD를 발생한다. 상기 종합판단부(600)는 다수결회로로서 현재의 출력상태에서 반대 상태의 판단신호가 일정 개수이상 발생되지 않으면 출력신호의 상대변화는 일어나지 않는다. 또한 수신 오디오 신호가 음성 및 음악으로 변화하는 상태 변화가 심한 경우 채터링 현상이 발생된다. 이를 위해서 상기 종합판단부(600)내에 채터링 소거 회로를 삽입하여 일정 시간지연 후 상태변화 신호를 출력할 수 있도록 한다.
상기 설명한 바와 같이 수신 오디오 신호가 음성신호인가 또는 음악신호인가를 판단하는 경우, 음악 및 음성 신호의 고유 특성에 따라 다수개의 판단 신호를 발생한다. 본 발명이 음성/음악판별 장치는 다수개의 판단유니트 및 종합판단부를 구비한다. 그리고 상기 각각의 판단 유니트들은 독립적으로 수신 오디오 신호의 스테레오 성분의 유무, 음의 고저강약, 음의 단속성 유무, 음의 대역폭 및 해당 대역폭내의 피크주파수 변동들을 분석하여 판단 신호들을 출력한다. 이때 상기 판단 유니트들은 수신 오디오 신호의 상태에 따라 순간적인 오차를 발생할 수 있다. 그러므로 상기 종합판단부(600)는 임의 시점들에서 발생되는 상기 판단신호들을 종합적으로 분석하여, 다수결에 의해 수신 오디오 신호가 음성인가 또는 음악인가를 판단한다. 따라서 각 판단 유니트들의 순간 오차율이 있더라도, 상기 종합판단부(600)는 정확하게 수신 오디오 신호의 상태를 식별하여 음성 또는 음악으로 판단할 수 있다.
또한 상기 음성/음악판별 장치는 상기 종합판단부(600)를 출력하는 음성/음악 판별신호 V/MD를 이용하여 음악의 재생 능력을 향상시킬 수 있다. A/V가공부(700)는 상기 입력버퍼(800)를 출력하는 오디오 신호를 수신하여 상기 종합판단부(600)의 제어에 의해 음악일시 오디오 신호의 저역 및 고역을 부스트하여 출력하고, 음성일시에는 수신 오디오 신호를 그대로 출력시킨다. 출력버퍼(900)는 상기 A/V가공부(700)를 출력하는 오디오 신호를 최종 오디오 신호로 증폭 출력하게 된다. 따라서 A/V가공부(700)는 수신 오디오 신호가 음악으로 판단되는 경우, 오디오 신호의 저역과 고역을 부스트시켜 재생시 저음 및 고음영역을 박력있게 재생할 수 있다.
상기한 내용들을 판단 유니트 단위들로 나누어 각 유니트의 동작을 구체적으로 설명한다. 또한 여기서 수신되는 오디오 신호는 음성 및 음악 대역을 포함하는 스테레오 성분의 오디오 신호라고 가정한다.
먼저 우측 채널 및 좌측 채널로 분리되어 수신되는 입력 오디오 신호 RI 및 LI는 각각 제9도에 도시된 입력버퍼(800)의 증폭기 U28 및 U29를 통해 증폭된다.
제3a도 및 제3b도를 참조하여 전치 처리부(100)의 동작을 살펴본다. 상기 전치 처리부(100)의 구성을 살펴보면, 가산기(110)는 입력 오디오 신호 RI 및 LI를 수신하고, 두 입력 오디오 신호 RI 및 LI를 가산함으로서, 수신 오디오 신호의 전대역 신호를 발생한다. 상기 가산기(110)는 상기 입력 오디오 신호 RI 및 LI를 가산하는 기능 및 증폭하는 기능을 수행한다.
또한 음성성분 검출부(120)는 상기 가산기(110)의 출력을 수신하여 음성성분 신호 VO가 포함되어 있는 대역의 오디오 신호들만 여파하여 출력한다. 즉, 상기 음성성분 검출부(120)는 음성대역의 최대 주파수 이하로 상기 가산기(110)의 출력을 저역 여파하는 음성 저역 여파기(121)와, 상기 음성 저역 여파기(121)에 직렬 접속되어 음성대역의 최저 주파수 이상으로 상기 음성 저역 여파기(121)를 출력하는 오디오 신호를 고역 여파한다.
또한 음성성분 검출부(130)는 상기 가산기(110)의 출력을 수신하여 음성성분 신호 V0의 대역을 제외한 오디오 신호 대역에서 고역 음악성분신호 HS, 저역 음악성분 신호 LS 및 상기 두 신호 MS 및 LS를 믹싱한 음악성분 신호 MO를 발생한다. 즉, 상기 음악성분 검출부(130)는 상기 가산기(110)의 출력을 수신하여 상기 오디오 신호를 상기 음악성분 신호 VO의 최고 주파수 이상으로 고역 여파하여 고역 음악성분 신호 MS를 추출하는 음악 고역 여파기(131)와, 상기 가산기(110)의 출력을 수신하여 상기 오디오 신호를 상기 음악성분 신호 VO의 최저 주파수 이하로 저역 여파하여 저역 음악성분 신호 LS를 추출하는 음악 저역 여파기(132)와, 상기 두 여파기(131, 132)를 각각 출력하는 두 음악성분 신호 MS 및 LS를 믹싱하여 고역 또는 저역중에서 음악성분이 강한측의 음악신호인 음악성분 신호 MO를 발생하는 합성기(133)로 구성된다.
상기 전치 처리부(100)는 수신되는 오디오 신호 RI 및 LI의 전스테레오 신호 대역에서 중앙부위에 위치되는 음성성분 신호 VO의 대역과 좌, 우측에 정위되는 음악성분 신호 MS 및 LS를 추출하여, 이들 신호들을 각 판단 유니트로 공급하는 기능을 수행한다. 즉, 오디오 신호 대역에서 음악성분은 전 대역에 걸쳐 분포되어 있으나, 음성성분은 인간 목소리의 특성에 따라 오디오 신호 대역의 중앙부위에 위치하게 된다. 먼저 상기 오디오 신호 RI 및 LI가 수신되면, 가산기(110)는 두 신호 RI 및 LI를 가산한다. 이는 수신 오디오 신호의 전 대역 신호를 기준으로 하여, 수신되는 오디오 신호가 음악인가 또는 음성인가를 판단하기 위함이다. 따라서 제3b도에 도시된 바와 같이, 가산기(U1)는 저항 R32 및 저항 R33을 통해 수신되는 두 입력 오디오 신호 RI 및 LI를 수신하고, 이들 두 신호 RI 및 LI를 합하여 출력한다. 상기 가산기(U1)를 출력하는 아날로그 형태의 합신호는 다시 증폭기(U2)로 인가되며, 증폭기(U2)는 상기 합신호를 증폭하여 출력한다. 그러므로 상기 합신호는 수신 오디오 신호 RI 및 LI의 공통 신호대역의 성분들이 출력됨을 알 수 있다.
이후 상기 합신호는 음성성분 검출부(120) 및 음악성분 검출부(130)로 공급된다. 먼저 상기 음성성분 검출부(120)는 수신 오디오 신호 대역에서 음악성분 신호 VO를 추출하는 기능을 수행한다. 상기 음성성분 검출부(120)는 음성대역 이하의 오디오 신호를 추출하는 음성저역 여파기(121)와, 음성대역 이상의 오디오 신호를 추출하는 음성고역 여파기(122)가 직렬 접속되어 구성되어 있다. 따라서 음성저역 여파기(121)는 음성성분 대역의 최대 레인지를 차단주파수로 설정함으로서, 상기 합신호를 수신하여 음성대역 이하의 오디오 신호만을 저역 여파한다. 그리고 상기 음성고역 여파기(122)는 음성성분 대역의 최저 레인지를 차단 주파수로 설정함으로서, 상기 저역여파 신호를 수신하여 음성대역 이상의 오디오 신호만을 고역 여파한다. 이때 상기 음성성분 검출부(120)는 제3b도와 같이 구성할 수 있다. 여기서 저항 R47-R49 및 캐패시터 C20-C22의 값을 설정하여 차단주파수를 1.6K㎐로 설정하면, 필터 U3는 상기 합신호에서 106K㎐이하의 오디오 신호만을 출력한다. 그리고 저항 R50-R52 및 캐패시터 C23-C2의 값을 설정하여 차단주파수를 400㎐로 설정하면, 필터 U4는 400㎐ 이상의 오디오 신호만을 출력한다. 따라서 최종 출력되는 음성성분 신호 VO는 수신 오디오 신호 대역에서 400㎐-1.6K㎐ 사이의 존재하는 음성대역의 오디오 신호가 됨을 알 수 있다.
또한 상기 음성성분 신호 VO의 대역 이외에 존재하는 음악성분들을 추출하게 한다. 먼저 상기 합신호를 수신하는 음악고역 여파기(131)는 상기 음성성분 신호 VO의 대역이상을 갖는 오디오 신호를 고역 여파하고, 음악저역 여파기(13)는 상기 음성성분 신호 VO의 대역이하를 갖는 오디오 신호를 저역 여파한다. 따라서 상기 음악고역 여파기(131)는 고역 음악성분 신호 MS를 출력하고, 상기 음악 저역 여파기(132)는 저역 음악성분 신호 LS를 출력한다. 여기서 상기 제3b도의 저항 R53-R55 및 캐패시터 C26-C28의 값을 설정하여 차단 주파수를 3.2K㎐로 설정하면, 필터 U5는 상기 합신호에서 3.2K㎐이상의 오디오 신호들을 고역 여파한다. 그리고 저항 R56-R58 및 캐패시터 C29-C31의 값을 설정하여 차단 주파수를 200㎐로 설정하면, 필터 U6는 상기 합신호에서 200㎐이하의 오디오 신호들을 저역 여파한다. 따라서 상기 고역 음악성분 신호 MS는 3.2K㎐이상의 오디오 신호가 되며, 상기 저역 음악성분 신호 LS는 200㎐ 이하의 오디오 신호가 된다. 상기 필터 U5 및 U6를 출력하는 두 신호 MS 및 LS는 저항 VR2에서 믹싱되어 음악성분신호 MO로 출력된다. 즉, 상기 합성부(133)는 상기 두 신호 MS 및 LS를 합성하며, 이로 인해 출력 MO는 상기 두 신호 MS 및 LS 중 음악성분 값이 큰 쪽으로 발생된다. 상기 음악성분 신호 MO는 수신 오디오 신호가 음악성분을 갖는가를 판단하는데 기준신호가 된다.
상기 전치 처리부(100)는 상기한 바와 같이 수신 오디오 신호를 음성성분을 갖는 대역의 오디오 신호 VO와 음악 성분을 갖는 대역의 오디오 신호 MS 및 LS를 분리 추출한다. 또한 상기 두 음성성분 신호 MS 및 LS를 믹싱하여 출력하는데, 수신 오디오 신호가 저음 및 고음 대역이 강한 경우 MS 및 LS 신호가 큰 값을 갖고 출력되므로, 상기 음악성분 신호 MS는 "하이"레벨을 갖게 된다. 그러나 수신 오디오 신호가 중음 대역이 강한 경우 MS 및 LS 신호가 작은 값을 갖고 출력되므로 상기 음악성분 신호 MO는 로우레벨을 갖게 된다.
두 번째로 입력 오디오 신호의 스테레오 성분을 검출하여 음악 또는 음성으로 판단하는 스테레오 검출부(120)의 동작을 제4a도 및 제4b도를 참조하여 살펴본다. 상기 오디오 신호가 스테레오 성분으로 구성된 경우, 음악 성분을 갖게되면 좌, 우측 채널에는 각각 다른 값을 갖는 오디오 신호가 실리게 된다. 그러나 인간의 음성신호는 모노에 가까운 신호로 양측 채널에 실리게 된다. 절대치회로(210)는 두 입력 오디오 신호 RI 및 LI를 수신하여 두 입력 오디오 신호를 차동 증폭한 후 절대값을 취한다. 즉, 상기 절대치회로(210)는 제4b도와 같이 구성되는데, 증폭기(U7)는 두 입력 오디오 신호 RI 및 LI의 차신호를 발생하며, 다이오드 D2 및 D3에 의해 정류되어 (-)성분을 갖는 차신호의 절대값을 발생한다. 즉, 상기 절대치회로(210)는 입력된 응답에 비례하는 (-)성분의 정류신호를 출력하게 된다. 따라서 상기 오디오 신호는 음성인 경우 양측 채널에 거의 동일한 레벨의 신호가 실리게 되고, 음악인 경우 양측 채널에 서로 상이한 레벨의 신호가 실리게 된다. 따라서 차동 증폭기(U1)는 음악인 경우 소정 레벨을 갖는 차신호를 발생하게 되고, 음성인 경우 차신호가 없게 되므로 출력이 없게 된다.
이후 적분기(220)는 상기 차신호의 절대값을 적분한다. 이때 상기 적분기(220)는 음성성분 신호 VO의 +측 정류신호 MID와 상기 차신호를 함께 적분한다. 이때의 상기 적분기(220)의 출력은 음성인 경우 "로우"레벨의 출력을 발생하며, 음악인 경우 "하이"레벨의 출력을 발생한다. 상기 MID는 후술하는 고저 검출부(300)에서 발생되는 음성성분 신호 VO의 (+)측 정류 신호이다. 따라서 상기 적분기(220)는 수신 오디오 신호의 좌, 우측 채널의 차신호에서 중음대역을 갖는 음성성분 신호의 응답을 감산한 결과치를 출력하게 된다. 따라서 상기 적분기(220)의 출력 결과는 좌, 우 채널의 오디오 신호에 대한 차신호에서 음성의 응답을 감산한 값이 되므로, 상기 적분기(220)의 출력은 음악인 경우에는 "하이"신호가 되고, 음성인 경우에는 "로우"신호가 된다.
상기 적분기(220)의 출력을 입력하는 히스테리시스 회로(230)는 상기 적분기(220)의 출력을 반전하여 출력한다. 이때 저항 R45 및 R46에 의해 상기 히스테리시스 회로(230)는 슈미트 트리거 동작을 수행하게 되므로, 시간적으로 음성 및 음악 판단의 빠른 변동을 제어할 수 있다.
따라서 상기 스테레오 검출부(200)는 수신 오디오 신호 RI 및 LI의 스테레오 성분에 따라 음악인 경우 "로우"신호를 출력하게 되며, 음성인 경우 "하이"신호를 출력하게 된다. 또한 수신되는 오디오 신호가 모노신호인 경우에는 양측 채널에 동일한 레벨의 오디오 신호가 실리게 되므로 상기 스테레오 검출부(200)의 접속은 단절시키는 것이 좋다.
세 번째로 제5a도 및 제5b도를 참조하여, 입력 오디오 신호의 고, 저음의 강약을 검출하는 고저 검출부(300)의 동작을 살펴본다.
먼저 상기 음성성분 신호 VO는 절대치 변환기(320)로 인가되며, 상기 절대치 변환기(320)는 상기 음성성분 신호 VO를 절대값으로 변환하기 위하여 (+)측으로 정류한다. 즉, 상기 음성성분 신호 VO는 다이오드 D5 및 D6에 의해 음성성분 신호 VO의 (+)측 파형이 출력됨을 알 수 있다. 이 신호는 상기한 MID 신호로서, 스테레오 검출부(200)의 적분기(220)로 인가되는 동시에 후술하는 단속검출부(400)의 차동증폭기(420)로 인가된다. 상기 MID 신호는 상술한 바와 같이 음성신호 대역의 (+)측 정류 신호가 된다.
또한 상기 음악성분 신호 MO는 절대치 변화기(310)로 인가되며, 상기 절대치 변환기(310)는 상기 음악성분 신호 MO를 절대값으로 변환하기 위하여 (-)측으로 정류한다. 즉, 상기 음악성분 신호 MO는 다이오드 D3 및 D4에 의해 음악성분 신호 MO의 (-)측 파형이 출력됨을 알 수 있다. 상기 절대치 변환기(310)의 출력은 음악성분 대역에서 고역 또는 저역측으로 치우쳐진 음악 성분을 갖게 되므로, 수신 오디오 신호가 음악인가 또는 음성인가를 판단하기 위한 기준 신호가 된다. 이때 절대치 변화기(310)의 가변저항 VR7은 음악성분 신호 MO가 존재하는 경우 상기 MID 신호보다 출력을 크게 가변할 수 있도록 가변된다.
이후 적분기(330)는 상기 절대치 변환기(310, 320)를 출력하는 두 신호를 적분 하는데, 상기 적분 과정에서는 음악과 음성의 음압차가 적분되어져 음악 성분이 강하게 출력된다. 그러므로 상기 적분기(330)는 음악 및 음성신호의 읍압차를 적분 출력하여 음악인 경우 "하이"신호를 출력하고, 음성인 경우 "로우"신호를 출력한다.
상기 적분기(330)의 출력을 수신하는 히스테리시스 회로(340)는 상기 적분기(330)의 출력을 반전 출력한다. 이때 저항 R68 및 R69에 의해 상기 히스테리시스 회로(340)는 슈미트 트리거 동작을 수행하여 음악 및 음성 판단의 변화가 빠를 경우 일정 시간 주기로 변동을 제어한다.
따라서 상기 고저 검출부(300)는 음악성분 신호 MO의 대역인 고역 또는 저역의 음압이 강하면 음악으로 판단하는 "로우"신호를 출력하고, 음성성분 신호 VO의 대역인 중역의 음압이 강하면 음성으로 판단하는 "하이"신호를 출력한다.
네 번째는 제6a도 및 6b도, 제6c도를 참조하여 오디오 신호의 단속성을 검사한다. 일반적으로 음성 신호의 엘벨로프는 음악 신호의 엔벨로프보다 길다. 즉, 음성 신호는 음악 신호보다 엔벨로프가 길게 유지되며, 음악 신호는 음성 신호보다 엔벨로프가 짧다. 따라서 음악 신호는 음성 신호보다 단속성이 크다는 것을 알 수 있다. 먼저 절대치 변환기(410)는 음성성분 신호 VO를 수신하여 절대값으로 변환함으로서, 음성 신호의 (-)측 파형 신호를 출력한다. 차동증폭기(420)는 상기 절대치 변환기(410)의 출력과 MID 신호를 수신하여 그 차 신호를 증폭한다. 이때 상기 절대치 변환기(410)의 출력은 음성성분 신호 VO의 (-)측 출력이고, 상기 MID 신호는 음성성분 신호 VO의 (+)측 출력이다. 따라서 상기 차동증폭기(420)는 음성성분 신호 VO의 전파 정류 신호를 제6c1도와 같이 출력하게 된다.
이후 변동 검출부(430)는 상기 적분기(420)를 출력하는 제6c1도와 같은 엔벨로프 신호의 단속성을 분석하여 수신 오디오 신호가 음성인가 또는 음악인가를 판단한다. 상기 변동검출기(430)는 제6b도와 같이 구성할 수 있는데, 다단의 비교기 U16-U18와 이들 각각에 기준전압을 공급하는 가변저항 VR9-VR11과 풀업저항 R78-R80 및 커패시터 C39-C40로 구성된다. 즉, 상기 변동 검출기(420)는 상기 엔벨로프 신호를 고속 비교하는 비교기 U16-U17의 출력단에 연결되는 풀업저항 R78-R79와 병렬로 캐패시터 C39-C40를 접속하여 2단의 원쇼트 멀티바이브레이터 기능을 수행한다. 따라서 상기 제6c1도와 같은 엔벨로프 신호는 미분화로 구성의 캐패시터 C38과 저항 R77을 통과하면 제6c2도와 같이 출력된다. 그리고 상기 제6c2도와 같은 미분신호는 비교기 U16에 인가되어 가변저항 VR9에 의해 설정되는 기준신호와 비교되며, 저항 R78과 캐패시터 C39에 제6c3도와 같은 비교신호를 발생한다. 또한 상기 제6c3도와 같은 비교신호는 비교기 U17에 인가되어 가변저항 VR10에 의해 설정되는 기준신호와 비교되며, 저항 R79와 캐패시터 C40에 의해 제6c4도와 같은 비교신호를 발생한다. 그리고 상기 제6c4도와 같은 비교신호는 비교기U18에 인가되어 가변저항 VR11에 의해 설정되는 기준신호와 비교되어 제6c5도와 같은 최종 결과 신호를 출력한다. 이때 상기 비교기 U16-U18로 각각 인가되는 비교신호들은 제1비교신호가 VR9에 의해 -5V에서 0V 사이에 의해 결정되고, 제2비교신호가 VR10에 의해 0V에서 +5V 사이에 결정되며, 제3비교시호가 VR11에 의해 0V에 의해 0V에서 5V사이에 결정된다. 이 경우 수신 오디오 신호가 음성 신호로 판단되면 "하이"신호로 출력되고, 음악 신호로 판단되면 "로우"신호로 출력된다.
따라서 상기 단속검출부(400)는 상기 음성성분 신호 VO를 절대값으로 변화한 후, 이러한 음성성분 신호 VO에 대한 엔벨로프의 단속성 상태를 판단하여 엔벨로프가 연속성으로 판단될 시 음성신호로 출력하고, 엔벨로프가 단속성으로 판단될 시 음악 신호로 출력한다.
다섯 번째로 제7a도 및 제7b도를 참조하여 피크 주파수의 변동상태를 판단하는 동작을 살펴본다. 먼저 상기 고역 음악성분 신호 HS를 처리하여 대역폭을 결정하는 구성 및 상기 저역 음악성분 신호 LS를 처리하여 대역폭을 결정하는 구성은 동일하다. 즉, 입력 음악성분 신호 HS 및 LS는 각각 스위치드 캐패시터 필터(510, 550)에 의해 여파하고, 입력 음악성분 신호와 상기 여파신호가 절대치 변환기(521, 522, 561, 564)에 의해 절대값으로 변환 후 합성기(523, 563)에서 합성된다. 또한 상기 합성신호는 각각 적분기(530, 570)에 의해 적분되어 입력 신호에 비례하는 전압신호로 발생된다. 그리고 상기 적분신호로 발진기(540, 580)로 각각 인가되어 스위치드 캐패시터 필터(510, 550)의 제어 주파수를 공급하게 된다. 그리고 상기 두 적분 신호는 차동증폭기(591)로 인가되어 차신호를 발생하며, 이 신호가 검출된 대역폭대의 피크 주파수 변동 신호로 되어 히스테리시스 회로(592)를 통해 출력된다.
여기서 상기 스위치드 캐패시터 필터(510, 550)는 "MF10"(National Semiconductor사 제품)을 사용할 수 있으며, 발진기(540, 580)은 "MC4046"(motorola사 제품)을 사용할 수 있다. 상기 스위치드 캐패시터 필터(210, 540)는 다수개의 동작 모드를 갖고 있는데, 본 발명에서는 "모드 3"을 사용하며, 차단 주파수를 제어 주파수의
Figure kpo00004
로 하여 상태변수 필터의 저역여파 출력 및 고역여파 출력을 사용한다. 따라서 제7도에 도시된 바와 같이 상기 스위치드 캐패시터 필터(IC1, IC2)는 수신되는 음악성분 신호와 소정 대역으로 쉬프트된 음악성분 신호를 각각 출력한다. 그러면 각 스위치드 캐패시터 필터(IC1, IC2)의 출력단에 연결된 증폭기 U19-U20에는 극성이 서로 다른 형태로 다이오드 D9-D16가 각각 접속된다. 따라서 상기 극성이 다른 정류 신호들은 각각 가변저항 VR12 및 VR14에서 믹싱된다. 이때 상기 가변정항 VR12 및 V14는 "하이"/"로우"값은 설정하게 된다. 상기 가변저항 VR12 및 VR14에 의해 설정된 전압값은 적분기 U21, U25로 각각 인가되며, 상기 각각의 적분기 U21, U25는 고역 음악성분 신호 HS 및 저역 음악성분 신호 LS측의 음압인 "하이"/"로우"비로 설정된 분압값을 적분하여 발진기 IC3, IC4의 제어 전압으로 각각 인가한다. 그러면 상기 발진기 IC3, IC4는 각각 상기 제어전압에 의해 제어 주파수를 발생하여 상기 스위치드 캐패시터 필터 IC1, IC2로 각각 인가한다. 이때 고역 음악성분 신호 HS의 음압이 크게 되면 동작 주파수가 높게 되고, 저역 음악성분 신호 LS의 음압이 크게 되면 동작 주파수가 낮게 되도록, 상기 발진기 IC3, IC4의 제어전압 부호가 선택되도록 구성되어 있다.
상기와 같이 고역 및 저역 음악성분 신호 HS 및 LS의 대역폭이 검출되며, 이들 신호는 차동증폭기 U22로 각각 입력되어 두 신호의 차성분이 발생된다. 이때 수신 오디오 신호가 음악성분인 경우에는 저역 또는 고역에 음악 성분이 존재하게 되므로, 상기 차동증폭기 U22는 "하이"레벨의 출력을 발생하게 된다. 그러나 중음 영역의 음성성분만 존재하면 상기 차동증폭기 U22는 "로우"레벨의 출력을 발생하게 된다. 상기 차동증폭기 U22의 출력을 입력하는 반전기 U26은 가변저항 VR16에 의해 슈미트 트리거 동작을 수행하며, 상기 차동증폭기의 출력을 반전한다.
따라서 상기 피크변동 검출부(500)는 두 입력신호 MS 및 LS의 고역음압과 저역음압의 비가 "하이"/"로우"비로 되는 상태를 발생하며, 이를 두 개로 조합한 후 한쪽을 "하이"로 다른 한쪽을 "로우"로 입력하여 각각의 발진 제어 전압차를 결정함으로 대역폭을 검출한다. 이후 검출 대역폭내의 피크 주파수 변동을 판단하여 수신 오디오 신호가 음악인가 또는 음성인가를 판단한다.
상기와 같이 본 발명에서는 수신 오디오 신호의 특성을 분석하여 다수개의 판단신호를 출력한다. 즉, S/MD는 수신 오디오 신호의 스테레오 성분 상태를 분석하여 모노에 가까우면 음성으로 판단하며, 스테레오 성분을 많이 갖게 되면 음악으로 판단하게 된다. 또한 H/LD는 음악 성분이 속하는 음성신호 대역 이외의 고역 및 저역의 음압 상태를 검출하는 고역 또는 저역에 음압이 크면 음악으로 판정하고, 작으면 음성으로 판단한다. ITD는 수신 오디오 신호의 엔벨로프를 검출하여 엔벨로프의 연속성이 존재하면 음성신호로 판정하고 단속성이 크면 음악으로 판단한다. PVD는 고역 및 저역 음악성분의 대역 폭을 검출하고, 검출대역폭 내의 피크 주파수 변동을 분석하여, 변동이 크면 음악으로 판단하고, 변동이 작으면 음성으로 판단한다. 이때 상기 S/MD, H/LD, ITD 및 PVD들은 음악으로 판단될 시 각각 로우신호를 출력하고 음성으로 판단될 시 하이 신호를 출력한다.
그러나 상기와 같은 판단유니트들은 각각 대응되는 해당 특성에 따라 수신 오디오 신호를 음악 또는 음성으로 판단하게 된다. 따라서 상기 각 판단유니트들의 출력은 순간 오차율이 크게될 수 있다. 그러므로 제8a도 및 제8b도에 도시된 종합판단부(600)는 상기 각 판단 신호들을 수신하여 종합판단한 최종 판단 신호 V/MD를 출력한다.
상기 판단신호 S/MD, H/LD, ITD PVD는 각각 판정기(610)로 인가되어 가산되므로서, 종합적으로 수신 오디오 신호가 음성 신호인지 또는 음악 신호인지를 판단하게 된다. 즉, 상기 판정기(610)는 제8b도와 같이 구성되는데, 상기 각 판단 신호들은 버퍼 IC5-IC8을 통해 반전된 후 저항 R24-R27에 의해 결정값으로 설정되어 비교기 U27로 인가된다. 이때 상기 비교기 U27은 음악으로 판단된 신호가 3개이상 수신된 경우에는 최종 판단신호 V/MD가 "로우"인 음악 신호를 출력하고, 음성으로 판단된 신호가 2개이상 수신된 경우에는 최종 판단신호 V/MD가 "하이"인 음성신호를 출력한다.
또한 상기 비교기 U27에 연결된 루프저항 R21, R22에 의해 출력이 정궤환되므로, 상기 비교기 U27은 슈미트 트리거 동작을 수행하여 히스테리시스 특성을 갖는다. 그리고 상기 루프저항 R21, R22에 병렬 접속된 무극성 캐패시터 C13, C14는 시간 조정기능(time lock-out)을 갖아, 상태변화가 발생될 시마다 이전에 충전된 전압을 감시 보호한다. 따라서 비교기 U27의 기준전압은 본래의 중심정압 보다 벗어나는 쪽에 있어, 이러한 상태에서 상태 변화가 일어나는 것으로 된다. 이때의 상기 기준전압은 결정값에 의해 전원전압의 바깥쪽에 벗어나 있지만, 이러한 상태에서 상기 비교기 U27을 보호하기 위하여 보호 다이오드 D17 및 D18을 연결한다.
스위칭회로(630)는 사용자에 의해 선택되는 기능으로, 사용자가 본 발명의 수행 유무를 결정하는 스위치 SW1을 A측으로 위치시키면, 상기 비교기 U27을 출력하는 종합판단 신호 V/HD가 출력된다. 이때 스위치 SW3도 연동되어 동작하게 된다. 그러나 상기 스위치 SW1을 B측에 위치시키면, 상기 비교기 O27의 출력은 단절하여, 스위치SW2의 선택에 따라 "하이" 또는 "로우"신호를 출력하게 된다.
또한 상기 각 판단 유니트들의 각 판단신호 결과를 표시하게 되는데, 상기 버퍼 IC5-IC8을 출력하는 각 판단신호들은 버퍼 IC3-IC12를 통해 반전되므로, 각 판단신호가 음악으로 판정된 경우 해당 판단신호에 연결된 발광 다이오드 LD1-LD5가 "온"되어 음악임을 표시하게 된다.
따라서 상기 종합판단부(600)는 각 판단신호들을 종합판정하여 수신오디오 신호가 음성인가 또는 음악인가를 최종 결정하므로, 순간 오차율이 극히 적은 정확한 판정 신호를 출력할 수 있다.
상기와 같이 정확하게 판단된 식별신호를 이용하면, 소형 시스템에서 음악을 효과적으로 재생할 수 있다. 제9a도 및 제9b도에 도시된 A/V가공부(700)는 상기 종합판단 신호 V/MD에 따라 수신되는 오디오 신호를 특성을 갖으며, 음악시에는 저음영역과 고음영역이 부스트된 출력특성을 갖게 된다.
먼저 부스트 회로(710, 720)는 오디오 신호 RI 및 LI를 각각 수신하여 음성신호 대역인 중음 대역을 제외한 저음영역과 고음영역의 오디오 신호를 부스트시킨다. 즉, RI 신호를 수신하는 증폭기 U30은 저항 R3-R6 및 저항 R7을 통해 RI 신호의 고음 영역을 부스트시켜 출력한다. 또한 LI 신호를 수신하는 증폭기 U31도 저항 R9-R12 및 커패시터 C5를 통해 LI 신호의 저음 영역을 부스트시키고, 캐패시터 C6 및 저항 R13을 통해 LI 신호의 고음 영역을 부스트시켜 출력한다.
상기 부스트회로(710, 720)는 오디오 신호와 본래의 입력신호는 각각 선택기(731, 720)에 인가되어 상기 종합판단부(600)의 출력에 의해 선택 출력된다. 즉, 증폭기 U30 및 U31의 부스트된 출력은 각각 스위치 SW4 및 SW6에 공급되며, 또한 입력 오디오 신호 RI 및 LI는 각각 스위치 SW5 및 SW7에 공급된다. 이때 상기 종합판단부(600)에서 음악 판단 신호를 출력하면, 상기 스위치 SW4 및 SW6이 온 스위칭되며, 음성판단 신호를 출력하면 상기 스위치 SW5 및 SW7이 온 스위칭된다. 따라서 음악판단 신호가 출력되면 증폭기 U30 및 U31을 통해 고음 및 저음 영역이 부스트된 신호가 출력되고, 음성판단 신호가 출력되면 입력버퍼(800)를 출력하는 입력 오디오 신호 RI 내지 LI가 그대로 선택 출력된다. 이때 캐패시터 C11 및 저항 R17과, 캐패시터 C12 및 저항 R18은 종합판단부(600)의 출력상태가 변화될 시 스위치 SW4-SW7의 갑작스런 스위칭에 의해 야기될 수 있는 잡음(pop noise)을 제거한다.
그러므로 상기 A/V가공부(700)를 사용하게 되면, 출력버퍼(800)j를 출력하는 음악 신호는 오디오 신호 대역에서 고, 저음과 저음영역이 부스트되어 스피커를 통해 박력있게 음악을 재생할 수 있으며, 음성신호는 플래트하게 재생하여 본래의 음성신호를 재생할 수 있다.

Claims (6)

  1. 오디오 신호의 판별장치에 있어서, 상기 오디오 신호를 입력하여 음성성분의 대역신호와 음악성분의 대역 신호로 분리 추출하는 전치 처리부와, 음성 및 음악의 고유특성을 식별하는 다수개의 판단 유니트를 구성되며, 상기 각각의 판단 유니트가 상기 음성대역 신호 또는 음악대역 신호를 수신하여 해당 판단 유니트의 고유식별 특성에 따라 음악 또는 음악판단 신호를 출력하는 판단부와, 상기 판단부의 각 판단 신호들을 수신하여 수신된 판단 신호들을 종합분석하여 종합적인 음악 또는 음성판단 신호를 발생하는 종합판단부로 구성됨을 특징으로 하는 오디오 대역신호의 음성/음악 판별장치.
  2. 제1항에 있어서, 전치 처리부가 수신 오디오 신호의 좌, 우측 채널 신호를 가산하는 수단과, 상기 가산수단의 출력을 수신하여 상기 오디오 신호 대역에서 음성신호 대역의 오디오 신호들을 여파하여 검출하는 수단과, 상기 가산수단의 출력을 수신하여 상기 오디오 신호 대역에서 음성신호 대역을 제외한 고역 및 저역음악 대역의 오디오 신호를 여파 출력하는 동시에 상기 두 여파신호를 합성 출력하는 수단으로 구성됨을 특징으로 하는 오디오 대역 신호의 음성/음악 판별장치.
  3. 제2항에 있어서, 판단부가 상기 오디오 신호를 수신하여 스테레오 성분유무를 검사하며, 모노로 판정될 시 음성 신호로 판정하는 제1판단 신호를 발생하는 수단과, 상기 전치 처리부를 출력하는 음악 신호 대역의 합성 신호를 수신하여 음악 대역인 고음 및 저역의 음압을 검출하고 상기 음압이 강할 시 음악 신호로 판정하는 제2판단 신호를 발생하는 수단과, 상기 전치 처리부를 출력하는 음성대역 신호를 수신하여 엔벨로프를 검출하고 엔벨로프의 단속성이 작을 시 음성신호로 판정하는 제3판단 신호를 발생하는 수단과, 상기 전치 처리부를 출력하는 고역 및 저역의 음악 신호를 수신하여 각 대역의 대역폭을 검출하고, 검출된 대역폭내의 피크 주파수 변동을 검사하여 피크 변동이 클 시 음악 신호로 판정되는 제4판단 신호를 출력하는 수단으로 구성됨을 특징으로 하는 오디오 대역 신호의 음성/음악 판별장치.
  4. 제3항에 있어서, 종합판정부가 상기 판단부의 제1-제4판단 신호를 수신하여 음악 또는 음성으로 판단한 각 신호의 구성비에 따라 수신 오디오 신호를 음악 또는 음성으로 종합판단 하도록 동작함을 특징으로 하는 오디오 대역 신호의 음성/음악 판별장치.
  5. 오디오 신호의 판별장치에 있어서, 상기 오디오 신호를 수신하여 음성 대역의 신호 및 음악 대역의 신호를 분리 추출하여 출력하는 전치처리 수단과, 상기 오디오 신호를 수신하여 우측 및 좌측 채널의 오디오 신호레벨에 따라 스테레오 성분 유무를 검사하며, 모노성분일 시 음성으로 판단하는 제1판단 신호를 출력하는 수단과, 상기 음악 대역의 신호를 수신하여 오디오 신호의 음압상태를 검사하고, 고역 및 저역의 음압이 클 시 음악으로 판단하는 제2판단 신호를 출력하는 수단과, 상기 음성대역의 신호를 수신하여 오디오 신호의 엔벨로프를 검출하고, 상기 검출 엔벨로프의 단속성이 작을 시 음성으로 판단하는 제2판단 신호를 출력하는 수단과, 상기 음악 대역의 신호를 수신하여 음악대역 신호의 대역폭을 검출하고, 상기 검출대역 폭이 피크 주파수 변동을 검출하여 피크 변동이 클 시 음악으로 판단하는 제4판단 신호를 출력하는 수단과, 상기 제1-제4판단 신호를 수신하여 음악 및 음성으로 판단한 각 신호와 구성비에 따라 음성/음악의 종합판단신호를 출력하는 수단으로 구성됨을 특징으로 하는 오디오 대역 신호의 음성/음악 판별장치.
  6. 제5항에 있어서, 상기 종합판단 신호에 의해 스위칭되어 음성 판단시 상기 수신 오디오 신호를 플래트하게 재생하고, 음악 판단시 상기 수신 오디오 신호의 저역 및 고역 신호를 부스트하여 재생하도록 동작하는 A/V가공 수단을 더 구비함을 특징으로 하는 오디오 대역 신호의 음성/음악 판별장치.
KR1019910005856A 1991-04-12 1991-04-12 오디오 대역신호의 음성/음악 판별장치 KR940001861B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1019910005856A KR940001861B1 (ko) 1991-04-12 1991-04-12 오디오 대역신호의 음성/음악 판별장치
US07/802,042 US5298674A (en) 1991-04-12 1991-12-03 Apparatus for discriminating an audio signal as an ordinary vocal sound or musical sound
JP33224791A JP3156975B2 (ja) 1991-04-12 1991-12-16 オーディオ帯域信号の音声/音楽判別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019910005856A KR940001861B1 (ko) 1991-04-12 1991-04-12 오디오 대역신호의 음성/음악 판별장치

Publications (2)

Publication Number Publication Date
KR920020865A KR920020865A (ko) 1992-11-21
KR940001861B1 true KR940001861B1 (ko) 1994-03-09

Family

ID=19313174

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910005856A KR940001861B1 (ko) 1991-04-12 1991-04-12 오디오 대역신호의 음성/음악 판별장치

Country Status (3)

Country Link
US (1) US5298674A (ko)
JP (1) JP3156975B2 (ko)
KR (1) KR940001861B1 (ko)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
KR0129829B1 (ko) * 1994-09-28 1998-04-17 오영환 음향 변속 재생장치
US5506371A (en) * 1994-10-26 1996-04-09 Gillaspy; Mark D. Simulative audio remixing home unit
JPH08160975A (ja) * 1994-12-08 1996-06-21 Gengo Kogaku Kenkyusho:Kk カラオケ選曲装置
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US5983176A (en) * 1996-05-24 1999-11-09 Magnifi, Inc. Evaluation of media content in media files
DE19625455A1 (de) * 1996-06-26 1998-01-02 Nokia Deutschland Gmbh Vorrichtung und Verfahren zur Spracherkennung
JP3700890B2 (ja) * 1997-07-09 2005-09-28 ソニー株式会社 信号識別装置及び信号識別方法
US7013013B2 (en) * 1998-03-20 2006-03-14 Pioneer Electronic Corporation Surround device
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US7016835B2 (en) * 1999-10-29 2006-03-21 International Business Machines Corporation Speech and signal digitization by using recognition metrics to select from multiple techniques
US6629163B1 (en) 1999-12-29 2003-09-30 Implicit Networks, Inc. Method and system for demultiplexing a first sequence of packet components to identify specific components wherein subsequent components are processed without re-identifying components
JP3637871B2 (ja) * 2001-01-23 2005-04-13 ヤマハ株式会社 変調方式判別装置及び方法、復調器及び方法、オーディオ再生装置及び方法、情報記録媒体及びプログラム
KR20050026098A (ko) * 2002-08-02 2005-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 음악 콘텐트의 재생을 향상하기 위한 방법 및 장치
JP4348970B2 (ja) * 2003-03-06 2009-10-21 ソニー株式会社 情報検出装置及び方法、並びにプログラム
JP2006171458A (ja) * 2004-12-16 2006-06-29 Sharp Corp 音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP2006352403A (ja) * 2005-06-15 2006-12-28 Matsushita Electric Ind Co Ltd 音響再生装置
JP4587916B2 (ja) * 2005-09-08 2010-11-24 シャープ株式会社 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
KR100735246B1 (ko) * 2005-09-12 2007-07-03 삼성전자주식회사 오디오 신호 전송 장치 및 방법
JP4321518B2 (ja) * 2005-12-27 2009-08-26 三菱電機株式会社 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP4921191B2 (ja) * 2006-02-17 2012-04-25 キヤノン株式会社 デジタルアンプ及びテレビジョン受信装置
JP4442585B2 (ja) * 2006-05-11 2010-03-31 三菱電機株式会社 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP2008076776A (ja) * 2006-09-21 2008-04-03 Sony Corp データ記録装置、データ記録方法及びデータ記録プログラム
US8138409B2 (en) 2007-08-10 2012-03-20 Sonicjam, Inc. Interactive music training and entertainment system
JP2009192725A (ja) * 2008-02-13 2009-08-27 Sanyo Electric Co Ltd 楽曲記録装置
JP4327886B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
JP4327888B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム
US20100158260A1 (en) * 2008-12-24 2010-06-24 Plantronics, Inc. Dynamic audio mode switching
JP4439579B1 (ja) * 2008-12-24 2010-03-24 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
JP4621792B2 (ja) * 2009-06-30 2011-01-26 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
CN102498514B (zh) * 2009-08-04 2014-06-18 诺基亚公司 用于音频信号分类的方法和装置
EP2462584B1 (en) 2009-08-14 2013-12-11 The TC Group A/S Polyphonic tuner
JP2011065093A (ja) * 2009-09-18 2011-03-31 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法
KR101591704B1 (ko) * 2009-12-04 2016-02-04 삼성전자주식회사 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치
JP4937393B2 (ja) * 2010-09-17 2012-05-23 株式会社東芝 音質補正装置及び音声補正方法
US9374629B2 (en) 2013-03-15 2016-06-21 The Nielsen Company (Us), Llc Methods and apparatus to classify audio
KR102614577B1 (ko) 2016-09-23 2023-12-18 삼성전자주식회사 전자 장치 및 그 제어 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4377961A (en) * 1979-09-10 1983-03-29 Bode Harald E W Fundamental frequency extracting system
US4506379A (en) * 1980-04-21 1985-03-19 Bodysonic Kabushiki Kaisha Method and system for discriminating human voice signal
JPS5770300U (ko) * 1980-10-15 1982-04-27
DE3102385A1 (de) * 1981-01-24 1982-09-02 Blaupunkt-Werke Gmbh, 3200 Hildesheim Schaltungsanordnung zur selbstaetigen aenderung der einstellung von tonwiedergabegeraeten, insbesondere rundfunkempfaengern
JPS5852696A (ja) * 1981-09-25 1983-03-28 大日本印刷株式会社 音声認識装置
US4441203A (en) * 1982-03-04 1984-04-03 Fleming Mark C Music speech filter
US4692117A (en) * 1982-08-03 1987-09-08 Goodwin Allen W Acoustic energy, real-time spectrum analyzer
JPS605960A (ja) * 1983-06-25 1985-01-12 産業振興株式会社 既設建物の外壁改装工法
JPS61244200A (ja) * 1985-04-20 1986-10-30 Nissan Motor Co Ltd 音場改善装置
US4698842A (en) * 1985-07-11 1987-10-06 Electronic Engineering And Manufacturing, Inc. Audio processing system for restoring bass frequencies
US4690026A (en) * 1985-08-22 1987-09-01 Bing McCoy Pitch and amplitude calculator and converter which provides an output signal with a normalized frequency
EP0240286B1 (en) * 1986-04-01 1992-12-09 Matsushita Electric Industrial Co., Ltd. Low-pitched sound creator
JP2522529B2 (ja) * 1988-10-31 1996-08-07 株式会社東芝 音響効果装置
JPH02211499A (ja) * 1989-02-13 1990-08-22 Nec Off Syst Ltd 自動写譜装置
US5157215A (en) * 1989-09-20 1992-10-20 Casio Computer Co., Ltd. Electronic musical instrument for modulating musical tone signal with voice
JP3033061B2 (ja) * 1990-05-28 2000-04-17 松下電器産業株式会社 音声雑音分離装置
US5210366A (en) * 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition

Also Published As

Publication number Publication date
KR920020865A (ko) 1992-11-21
JPH0588695A (ja) 1993-04-09
JP3156975B2 (ja) 2001-04-16
US5298674A (en) 1994-03-29

Similar Documents

Publication Publication Date Title
KR940001861B1 (ko) 오디오 대역신호의 음성/음악 판별장치
TW401713B (en) BTSC encoder and adaptive signal weighing system
US6026168A (en) Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
JP3193032B2 (ja) 車載用自動音量調整装置
US8238577B2 (en) Audio system with tone controller for use in a computer
US20050094828A1 (en) Bass boost circuit
EP1640973A2 (en) Audio signal processing apparatus and method
US4357492A (en) Automatic microphone mixing apparatus
US6862636B2 (en) Multi-mode speaker operating from either digital or analog sources
US6246773B1 (en) Audio signal processors
JPH02235260A (ja) ボイスチェンジ回路
NL7901477A (nl) Geluidsweergave in een ruimte met een onafhankelijke geluidsbron.
JP3220220B2 (ja) ステレオ受信の可聴雑音の減少
US20070127731A1 (en) Selective audio signal enhancement
US4771280A (en) Acoustical visual sound device
JPH03297300A (ja) ボイスキャンセル回路
US10728667B2 (en) Active channel crossover system
US5389730A (en) Emphasize system for electronic musical instrument
US5400410A (en) Signal separator
JPH11103495A (ja) 音響再生装置の位相補償システム
EP0901677A1 (en) Device for determining the quality of an output signal to be generated by a signal processing circuit, and also method
US20060139093A1 (en) Three-channel state-variable compressor circuit
JP2003188660A (ja) 電力調整装置
JP2002095095A (ja) 音量制御装置
KR0176831B1 (ko) 마이크 믹싱 장치

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080228

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee