KR0129829B1 - 음향 변속 재생장치 - Google Patents

음향 변속 재생장치 Download PDF

Info

Publication number
KR0129829B1
KR0129829B1 KR1019940024514A KR19940024514A KR0129829B1 KR 0129829 B1 KR0129829 B1 KR 0129829B1 KR 1019940024514 A KR1019940024514 A KR 1019940024514A KR 19940024514 A KR19940024514 A KR 19940024514A KR 0129829 B1 KR0129829 B1 KR 0129829B1
Authority
KR
South Korea
Prior art keywords
signal
sound
sound source
voice
main controller
Prior art date
Application number
KR1019940024514A
Other languages
English (en)
Inventor
오영환
김연준
Original Assignee
오영환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오영환 filed Critical 오영환
Priority to KR1019940024514A priority Critical patent/KR0129829B1/ko
Priority to GB9519586A priority patent/GB2293741B/en
Priority to JP7249848A priority patent/JPH08190400A/ja
Priority to CNB95118654XA priority patent/CN1143293C/zh
Priority to US08/535,517 priority patent/US5781696A/en
Application granted granted Critical
Publication of KR0129829B1 publication Critical patent/KR0129829B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

명령어가 저장되어 있는 명령어 기억회로(29)와; 음향신호 데이터가 저장되어 있는 기억장치(30)와; 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 출력하는 주제어기(28)와; 애널로그 입력신호를 디지틀 신호로 변환, 출력하는 애널로그/디지틀 컨버터(21)와; 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼(22)와; 입력신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로(23)와; 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조, 출력하는 피치 변조부(24)와; 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로(25)와; 변속된 음성신호를 일시 저장하는 출력버퍼(26)와; 디지틀 변속신호를 애널로그 신호로 변환, 출력하는 디지틀/애널로그 컨버터(27)로 구성되어 있으며; 음향 재생장치로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것.

Description

음향 변속 재생장치
제1도는 종래의 음성변속 재생방식으로 나타낸 도면이고,
제2도는 음성생성모델을 전자 회로화하여 나타낸 도면이고,
제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호처리과정을 나타낸 도면이고,
제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이고,
제5도는 이 발명의 실시예에 따른 음향 변속 재생장치의 분석부 과정에서 분리된 음원 및 음향특성의 형태를 나타낸 도면이고,
제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.
* 도면의 주요부분에 대한 부호의 설명
21 : 애널로그/디지틀 컨버터 22 : 입력버퍼
23 : 피치검출 회로 24 : 피치 변조부
25 : 음성합성 회로 26 : 출력버퍼
27 : 디지틀/애널로그 컨버터 28 : 주제어기
29 : 명령어 기억회로 30 : 기억장치
이 발명은 음향 변속 재생장치에 관한 것으로서, 더욱 상세하게 말하자면 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것이다.
테이프 또는 비디오 플레이어의 재생(play back) 속도를 변경하는 경우에, 속도를 빠르게 재생시키면 원래의 음의 높이로부터 벗어나서 '삐리삐리'하는 소리처럼 들리게 된다. 그리고, 속도를 느리게 재생시키면 우리가 흔히 말하는 '테이프 늘어지는 소리'가 나게 된다.
상기한 바와 같은 현상을 방지하기 위하여, 종래에는 음성 또는 음향신호를 버퍼에 읽어 들여서 일부분만을 재생하는 방법을 사용한다. 즉, 종래에는 음성 또는 음향신호를 메모리 버퍼에 읽어들여서, 재생속도를 2배로 하는 경우에는 2개의 시간단편(time-slice) 중에서 하나만을 재생시키는 방법을 사용한다.
따라서 종래의 방법으로 '나는 영희와 함께 학교에 가다'를 2배속으로 재생시키면 제1도에 도시된 바와 같이 원음중에서 무늬진 부분의 음성은 탈락되어 '나는 함께 간다'만을 재생하게 된다.
이와 같이, 기존의 방법은, 재생속도를 빠르게 하는 경우에 음성의 음색을 유지하기 위하여 음성의 일부분만을 재생하게 되므로 원래의 음성의 의미를 보존하지 못하고 상실하게 된다. 따라서, 재생장치를 이용하여 음성의 의미를 이해하는데 많은 어려움을 겪게 되며, 듣는이로 하여금 거부감을 느끼게 하는 문제점이 있다.
이 발명의 목적은 상기한 종래의 문제점을 해결하기 위한 것으로서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치를 제공하는데 있다.
상기한 목적을 달성하기 위한 수단으로서 이 발명의 구성은, 명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어진다.
이하, 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 이 발명을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 이 발명의 가장 바람직한 실시예를 첨부된 도면을 참조로 하여 설명하기로 한다.
제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이다.
제4도에 도시되어 있듯이 이 발명의 실시예에 따른 음향 변속 재생장치의 구성은, 입력 신호선(Audio In)과 프로그램 버스에 연결되어 있는 애널로그/디지틀 컨버터(21)와, 애널로그/디지틀 컨버터(21) 및 프로그램, 데이터 버스에 연결되어 있는 입력버퍼(22)와, 입력버퍼(22) 및 프로그램 버스에 연결되어 있는 피치검출 회로(23)와, 피치검출 회로(23)에 연결되어 있는 피치 변조부(24)와, 피치 변조부(24)와 프로그램, 데이터 버스에 연결되어 있는 음성합성 회로(25)와, 음성합성 회로(25)와 프로그램 버스에 연결되어 있는 출력버퍼(26)와, 출력버퍼(26)와, 프로그램 버스에 연결되어 있는 디지틀/애널로그 컨버터(27)와, 프로그램 버스에 연결되어 있는 주제어기(28)와, 주제어기(28)에 연결되어 있는 명령어 기억회로(29)와, 프로그램, 데이터 버스에 연결되어 있는 기억장치(30)로 이루어진다.
음향 변속 재생장치 전체를 제어하는 역할은 주제어기(28)가 수행하며, 주제어기(28)에서 각 부분을 제어하기 위해 필요한 명령어들은 명령어 기억회로(29)에 저장되어 있다. 그리고, 음향신호 데이터는 기억장치(30)에 저장된다.
각 블럭간의 제어신호와 데이터의 전달은 프로그램 버스와 데이터 버스에 의해서 각각 이루어지는데, 프로그램 버스는 주제어기(28)로부터 내려지는 명령을 제어하고자하는 부분으로 전달해주는 역할을 담당하고, 데이터 버스는 입력버퍼로부터 음향 데이터를 받아서 기억장치(30)에 저장했다가 음성합성시에 이를 음성합성 회로(25)에 전달함으로써 음성합성 회로(25)에서 변조된 음원신호와 함께 재합성되도록 한다.
상기한 구성에 의한, 이 발명의 실시예에 따른 음향 변속 재생장치의 작용은 다음과 같다.
이 발명에서 사용되는 방식은 음성생성모델(speech production model)에 근거한다. 음성생성모델은 사람의 발성기관을 모의한 것으로, 음성을 음성발생의 근원인 음원과 조음기관(혀, 이, 입술 등)에 의한 음향전달특성을 나타낸다.
음성생성모델에 의하면, 음성은 사람의 허파에서 시작된 공기의 흐름이 성대(voice cord), 또는 구강내의 혀, 이, 입술 등에 의해 만들어진 좁은공간, 즉 조음점(point of articulation)의 부위에 각각 주기적 또는 잡음성의 공기진동을 일으킨다. 이들이 음원(speech source)이 되어, 성대보다 위의 부위에 있는 기관, 즉 성도(vocal tract)의 조음(articulation) 동작에 의해 결정되는 음향 전달특성의 영향을 받아 음원의 주파수 성분이 선택적으로 공명함으로써 음성이 생성된다.
상기한 음성생성모델을 전자 회로화하여 도식적으로 나타낸 것이 제2도에 도시되어 있다.
본 방식은 위에서 설명한 음성생성모델에 근거한 것으로서, 제3도에 도시되어 있는 바와 같이, 입력신호로부터 음원과 음향특성을 분리해내는 분석부와, 분리된 신호를 원하는 재생속도에 따라 처리하는 변조부와, 변조된 신호를 이용하여 신호를 재합성해내는 합성부의 주요 3부분으로 나눌 수가 있다.
상기한 변조부는, 위에서 설명한 음성생성모델에 근거하여 분리된 음원신호를 처리하는 음원 변조부와, 음색 즉 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화(smoothing) 처리를 수행하는 음향특성 제어부로 나뉘어진다.
본 방식의 전체적인 흐름은 음향신호의 음색 또는 주파수를 그대로 유지하면서 재생속도를 변화시키기 위하여 입력된 음향신호를 분석하여 음원신호와 음향특성을 분리한 후, 분리된 데이터 각각을 변속 처리하고, 처리된 데이터를 이용하여 재합성하는 과정으로 이루어진다. 이러한 과정이 제3도에 잘 나타나 있다. 제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호 처리과정을 나타낸 도면이다.
본 발명의 가장 핵심부분인 분석부, 변조부, 합성부는, 제4도에서 각각 피치검출 회로(24), 피치 변조부(24), 음성합성 회로(25)에 해당한다.
이하, 제4도를 참조로 하여 이 발명의 실시예에 따른 음향 변속 재생장치의 동작을 설명하면 다음과 같다.
먼저, 음향신호(Audio In)가 입력되면, 애널로그 디지틀 컨버터(21)에 의하여 상기한 음향신호(Audio In)가 디지틀 신호로 변환된 뒤에 입력버퍼(22)를 거쳐서 피치검출 회로(23)로 출력된다.
분석부 과정에서, 주제어기(28)의 제어신호에 따라 피치검출 회로(23)는 음성생성모델에 의거하여 음향신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리한다. 이때, 음향신호로부터 음원의 위치를 구하기 위하여 상호 유사도(cross-amplitude difference) c(m,δ)(m-1번째 음원과 m번째 음원을 기준으로 신호의 차이를 측정한 값으로서 이때의 허용범위는 δ이다)를 아래의 식(1)과 같이 정의한다.
상기한 상호 유사도란 인접한 음원의 위치를 기준점으로 신호의 차이를 측정함으로써 신호의 유사도를 나타내는 척도로서 정의된다. 따라서, m번째 음원의 위치는 상호 유사도가 최소가 되는 위치 tm으로 결정되며, 이러한 과정을 입력된 신호에 대하여 반복적으로 수행함으로써 음원성분을 추출하게 된다.
여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.
제5도는 위의 분석부 과정으로부터 분리된 음원 및 음향특성의 형태를 그림으로 나타낸 것이다.
제5도에 도시되어 있듯이, 일반적인 음향신호는 준안정(quasi-stationary) 즉, 이웃하는 짧은 시간구간에서는 거의 유사한 특징을 지니는 것으로 나타난다. 이때, 유사한 신호특성을 지니는 가장 큰 신호 주기를 우리는 흔히 한 피치(pitch)라고 하는데, 본 발명의 분석부 과정에서는 입력된 음향신호로부터 이러한 피치주기, 즉 음원신호를 추출하여 음향재생의 속도를 조절하는데 이용한다.
변조부 과정에서는 상기한 분석부 과정에서 분리된 음원신호와 음향특성신호를 변조하는 과정을 수행한다. 따라서 피치 변조부(24)는, 음원신호를 처리하는 음원 변조부와, 음색 즉, 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화 처리를 수행하는 음향특성 제어부로 구성된다.
피치 변조부(24)의 음원 변조부에서는 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절한다. 보다 상세한 설명은 제6도를 참조한다. 제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.
제6도에 도시되어 있는 바와 같이, 음향의 재생속도를 느리게 하기 위해서는 이웃하는 음원간의 간격을 그대로 유지하면서 또다른 음원을 첨가하여 신호를 늘이고, 음원의 재생속도를 빠르게 하기 위해서는 이웃하는 음원의 간격을 유지하도록 하면서 하나씩 걸러서 음원을 선택하여 음향특성을 이용하여 재합성함으로써 가능하게 된다.
피치 변조부(24)의 음향특성 제어부에서는 음향신호 특성에 해당하는 부분을 식(2)에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수(window)를 씌워서 신호를 변조시킨다. 이는 나중에 음성합성시에 음원의 삭제 및 첨가에 의하여 신호가 변조된 경우에도 매끄러운 음향신호를 생성하기 위한 처리과정이다.
여기에서, xm(n)은 변조된 음향신호이고, hm(n)은 창함수이고, tm은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.
마지막으로, 합성부 과정이 이루어지는 음원합성 회로(25)에서는 위의 변조부 과정에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구한다. 이를 식으로 나타내면 아래의 식(3)과 같이 나타낼 수 있다.
여기에서, αq는 합성음량 조절변수이고, xq(n)=xm(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.
변속된 음성신호 x(n)은, 출력버퍼(26)를 거쳐서 디지틀 애널로그 컨버터(27)에 의하여 애널로그 신호(Audio Out)로 변환된 뒤에 출력된다.
본 방식에 의하여 음향을 재생할 경우에는 재생속도는 변화시키더라도 재생시키고자 하는 음성의 음색을 그대로 유지하면서 사람이 빨리 또는 천천히 발생하는 것처럼 들을 수가 있다.
따라서, VTR 플레이어와 같이 영상화면을 빠르게 재생하여 검색 또는 모니터링하는 경우, 기존의 VTR 플레이어처럼 음색이 변하여 듣기가 거북하거나 또는 음향신호의 손실로 시청자가 답답함이 느껴지지 않고 원래의 음색으로 빠르게 말하는 것과 같은 재생음을 얻을 수가 있다.
그외에도 멀티미디어 장비의 고속 스캐닝과 같은 응용에 적합할 것으로 예상된다. 앞으로 멀티미디어 시장의 성장과 함께 본 기술의 활용이 다양해질 것으로 생각된다.
이상에서와 같이 이 발명의 실시예에서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 효과를 가진 음향 변속 재생장치를 제공할 수가 있다.
이 발명의 이러한 효과는 각종 음향 재생장치의 설계, 제조, 판매 등의 분야에서 이용될 수가 있다.

Claims (4)

  1. 명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로와, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어지는 것을 특징으로 하는 음향 변속 재생장치.
  2. 제1항에 있어서, 상기한 피치 검출회로부는 다음의 수식에 의하여 음원성분을 추출하는 것을 특징으로 하는 음향 변속 재생장치.
    여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.
  3. 제1항에 있어서, 상기한 피치 변조부는 음향신호 특성에 해당하는 부분을 다음의 수식에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조시키는 것을 특징으로 하는 음향 변속 재생장치.
    xm(n)=hm(tm-n)x(n)
    여기에서, xm(n)은 변조된 음향신호이고, hm(n)은 창함수이고, tm은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.
  4. 제1항에 있어서, 상기한 음원합성 회로는 다음의 수식과 같이 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구하는 것을 특징으로 하는 음향 변속 재생장치.
    여기에서, αq는 합성음량 조절변수이고, xq(n)-xm(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.
KR1019940024514A 1994-09-28 1994-09-28 음향 변속 재생장치 KR0129829B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1019940024514A KR0129829B1 (ko) 1994-09-28 1994-09-28 음향 변속 재생장치
GB9519586A GB2293741B (en) 1994-09-28 1995-09-26 Speed-variable audio play-back apparatus
JP7249848A JPH08190400A (ja) 1994-09-28 1995-09-27 音響変速再生装置
CNB95118654XA CN1143293C (zh) 1994-09-28 1995-09-28 声音变速播放装置
US08/535,517 US5781696A (en) 1994-09-28 1995-09-28 Speed-variable audio play-back apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940024514A KR0129829B1 (ko) 1994-09-28 1994-09-28 음향 변속 재생장치

Publications (1)

Publication Number Publication Date
KR0129829B1 true KR0129829B1 (ko) 1998-04-17

Family

ID=19393736

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940024514A KR0129829B1 (ko) 1994-09-28 1994-09-28 음향 변속 재생장치

Country Status (5)

Country Link
US (1) US5781696A (ko)
JP (1) JPH08190400A (ko)
KR (1) KR0129829B1 (ko)
CN (1) CN1143293C (ko)
GB (1) GB2293741B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100337996B1 (ko) * 1999-02-27 2002-05-24 허진호 음성신호재생속도제어장치및제어방법
KR100677950B1 (ko) * 2005-06-09 2007-02-05 주식회사 아이웨어 음성신호를 보존하는 재생속도 가변 장치 및 방법

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2305830B (en) * 1995-09-30 1999-09-22 Ibm Voice processing system and method
JP3910702B2 (ja) * 1997-01-20 2007-04-25 ローランド株式会社 波形発生装置
JP4170458B2 (ja) 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6323797B1 (en) 1998-10-06 2001-11-27 Roland Corporation Waveform reproduction apparatus
JP2001075565A (ja) 1999-09-07 2001-03-23 Roland Corp 電子楽器
JP2001084000A (ja) 1999-09-08 2001-03-30 Roland Corp 波形再生装置
JP4293712B2 (ja) * 1999-10-18 2009-07-08 ローランド株式会社 オーディオ波形再生装置
JP2001125568A (ja) 1999-10-28 2001-05-11 Roland Corp 電子楽器
US7010491B1 (en) 1999-12-09 2006-03-07 Roland Corporation Method and system for waveform compression and expansion with time axis
US7136571B1 (en) 2000-10-11 2006-11-14 Koninklijke Philips Electronics N.V. System and method for fast playback of video with selected audio
US20050209847A1 (en) * 2004-03-18 2005-09-22 Singhal Manoj K System and method for time domain audio speed up, while maintaining pitch
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
JP4096915B2 (ja) * 2004-06-01 2008-06-04 株式会社日立製作所 デジタル情報再生装置及び方法
US7750229B2 (en) * 2005-12-16 2010-07-06 Eric Lindemann Sound synthesis by combining a slowly varying underlying spectrum, pitch and loudness with quicker varying spectral, pitch and loudness fluctuations
WO2008035829A1 (en) * 2006-09-22 2008-03-27 I-Ware Inc., Ltd. Apparatus and method for playback speed altering with preservation of tone signal
JP4952469B2 (ja) * 2007-09-19 2012-06-13 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US20160071524A1 (en) * 2014-09-09 2016-03-10 Nokia Corporation Audio Modification for Multimedia Reversal
JP6646001B2 (ja) * 2017-03-22 2020-02-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP2018159759A (ja) 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
US11039177B2 (en) * 2019-03-19 2021-06-15 Rovi Guides, Inc. Systems and methods for varied audio segment compression for accelerated playback of media assets
US11102523B2 (en) 2019-03-19 2021-08-24 Rovi Guides, Inc. Systems and methods for selective audio segment compression for accelerated playback of media assets by service providers
US10708633B1 (en) 2019-03-19 2020-07-07 Rovi Guides, Inc. Systems and methods for selective audio segment compression for accelerated playback of media assets
CN112750456A (zh) * 2020-09-11 2021-05-04 腾讯科技(深圳)有限公司 即时通信应用中的语音数据处理方法、装置及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4164626A (en) * 1978-05-05 1979-08-14 Motorola, Inc. Pitch detector and method thereof
US4624012A (en) * 1982-05-06 1986-11-18 Texas Instruments Incorporated Method and apparatus for converting voice characteristics of synthesized speech
AU574104B2 (en) * 1983-09-09 1988-06-30 Sony Corporation Apparatus for reproducing audio signal
US4783807A (en) * 1984-08-27 1988-11-08 John Marley System and method for sound recognition with feature selection synchronized to voice pitch
US5365592A (en) * 1990-07-19 1994-11-15 Hughes Aircraft Company Digital voice detection apparatus and method using transform domain processing
JPH04168499A (ja) * 1990-10-31 1992-06-16 Sanyo Electric Co Ltd 時間軸圧縮伸長装置
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
EP0517233B1 (en) * 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100337996B1 (ko) * 1999-02-27 2002-05-24 허진호 음성신호재생속도제어장치및제어방법
KR100677950B1 (ko) * 2005-06-09 2007-02-05 주식회사 아이웨어 음성신호를 보존하는 재생속도 가변 장치 및 방법

Also Published As

Publication number Publication date
GB2293741B (en) 1999-05-19
CN1143293C (zh) 2004-03-24
JPH08190400A (ja) 1996-07-23
US5781696A (en) 1998-07-14
CN1127916A (zh) 1996-07-31
GB2293741A (en) 1996-04-03
GB9519586D0 (en) 1995-11-29

Similar Documents

Publication Publication Date Title
KR0129829B1 (ko) 음향 변속 재생장치
US5862232A (en) Sound pitch converting apparatus
US20160071429A1 (en) Method of Presenting a Piece of Music to a User of an Electronic Device
KR100375329B1 (ko) 음원제어장치및음원제어방법
US8314321B2 (en) Apparatus and method for transforming an input sound signal
KR100251497B1 (ko) 음성신호 변속재생방법 및 그 장치
Dutilleux et al. Time‐segment Processing
JP3620787B2 (ja) 音声データの符号化方法
Canfer Music Technology in Live Performance: Tools, Techniques, and Interaction
JP3552675B2 (ja) 波形生成方法及び装置
KR100359988B1 (ko) 실시간 화속 변환 장치
JP3613191B2 (ja) 波形生成方法及び装置
JPH07287576A (ja) 音楽再生方法
KR0162422B1 (ko) 자동 반주기의 음성합성 장치
von Doehren Time is Ticking, Expressing Grief Through Time: Exploring the Production and Creative Techniques for a Composition for Flute and Electronics
Dofat Introduction to Digital Audio
JP3000567U (ja) 電子音楽再生装置
JPH11133996A (ja) 音程変換装置
Morris Live sampling in improvised musical performance: Three approaches and a discussion of aesthetics
JPH0644686A (ja) 光ディスク及び音場再生装置
Grew A guide to electro-acoustic performance for the acoustic oboist
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JP3876896B2 (ja) 波形生成方法及び装置
Rothstein Twelve Tone Systems Cakewalk Sequencer Software
JPH07152386A (ja) カラオケ装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101028

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee