KR20050088132A - 오디오 신호들의 순서화 - Google Patents

오디오 신호들의 순서화 Download PDF

Info

Publication number
KR20050088132A
KR20050088132A KR1020057011616A KR20057011616A KR20050088132A KR 20050088132 A KR20050088132 A KR 20050088132A KR 1020057011616 A KR1020057011616 A KR 1020057011616A KR 20057011616 A KR20057011616 A KR 20057011616A KR 20050088132 A KR20050088132 A KR 20050088132A
Authority
KR
South Korea
Prior art keywords
audio signals
sequence
audio
signal
operable
Prior art date
Application number
KR1020057011616A
Other languages
English (en)
Inventor
데이비드 에이. 이브스
크리스토퍼 톨네
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB0229940.2A external-priority patent/GB0229940D0/en
Priority claimed from GBGB0307474.7A external-priority patent/GB0307474D0/en
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050088132A publication Critical patent/KR20050088132A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • G10H1/0025Automatic or semi-automatic music composition, e.g. producing random music, applying rules from music theory or modifying a musical piece
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/081Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for automatic key or tonality recognition, e.g. using musical rules or a knowledge base
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/125Medley, i.e. linking parts of different musical pieces in one single piece, e.g. sound collage, DJ mix
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • G10H2250/035Crossfade, i.e. time domain amplitude envelope control of the transition between musical sounds or melodies, obtained for musical purposes, e.g. for ADSR tone generation, articulations, medley, remix

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

사용자 선호도를 수신(104)하고, 고유의 특징들을 추출하기 위해 복수의 오디오 신호들을 분석(108)하며, 사용자 관여없이, 시퀀스의 인접 신호들의 조화되도록, 추출된 특징들 및 사용자 선호도의 비교에 기초하여, 복수의 오디오 신호들 중 적어도 2개를 시퀀스에 순서화(110)는 것을 포함하는, 복수의 오디오 신호들을 시퀀스에 순서화하는 방법이 개시된다. 복수의 오디오 신호들은 사용자 선호도에 따라 식별(106)될 수 있다. 순서화된 오디오 신호들은 출력(112)될 수 있다.

Description

오디오 신호들의 순서화{Ordering audio signals}
본 발명은 복수의 오디오 신호들을 순서화하는 방법 및 시스템에 관한 것으로서, 특히 음악 트랙들의 순서화에 관한 것이다.
음악 트랙들을 포함하는 오디오 신호들을 고려하자. 통상적으로, 소비자는 일 세트의 트랙들을 선택하고, 이들을 적합한 청취 시퀀스에 순서화하기를 원한다. 기존에는, 이들 두 작업들이 예를 들어, 미리 결정된 재생 시퀀스에 순서화된 앨범(비닐 레코드, 오디오 CD등)상에 일 세트의 트랙들을 제공함으로써 음악 분배자들 또는 아티스트들에 의해 다루어져왔다. 새로운 분배 모델들(예컨대, 인터넷 다운로딩) 및 저장 모델들(디지털 파일들로서 저장된 음악 트랙들을 랜덤으로 액세스하는 능력을 포함하는)은 선택 및 배열의 작업이 분배자 또는 아티스트로부터 최종 사용자로 이주하였다. 일 레벨에서, 선택된 트랙들의 임의적인 시퀀싱은 예를 들어 CD 재생기들의 셔플(랜덤화된) 재생을 사용하여 가능하다. 이 기술의 이점은 미리 결정된 재생 시퀀스와 상이한 시퀀스를 발생하는데 그 사용이 용이(단일 버튼 누름)하다는 것이다; 그러나, 결과적인 시퀀스는 임의적이다. 어떤 CD 재생기들은 트랙들의 선택 및 순서화를 위한 수단을 채용한다. 이는 보다 많은 시간과 노력의 비용으로 커스터마이징된 시퀀스(customised sequence)가 사용자에 의해 결정되는 것이 가능하다. 더 최근에는, 디지털 음악 주크박스와 같은 제품들은 사용자가 사용자의 전반적 취향(들)을 나타내는 수백 개의 트랙들의 라이브러리를 구성하는 것이 가능하다. 잠재적으로 많은 트랙들로부터 재생시킬 일 세트의 트랙들을 선택하는 이슈가 제기된다. 사용자가 수동으로 트랙들을 고르는 것에서부터 예를 들어, 분류(아티스트, 타이틀, 장르 등)를 사용하는 자동선택에 이르기까지, 다양한 기술들이 이러한 세트를 선택하는데 이용 가능하다. 그러나, 트랙들의 적합한 순서화('재생 리스트'라고도 부르는)가 행해져야 한다는 단점이 여전이 남아있다; 이것은 사용자의 시간 및 노력이 필요할 뿐만 아니라 사용자의 선호도와 일치하는 순서화를 달성하기 위한 기술 또한 필요하다.
Hewlett Packard의 유럽 특허 출원 EP1162621은 결과적인 편집용 이상적인 일시적 맵(ideal temporal map)과 제5음 비트(dominant beat)의 반복율에 따라 노래들의 세트의 시퀀스를 자동을 결정하는 방법이 개시되며 이는 인접 노래들의 마지막 부분들이 중복된다. 이 방법의 단점은 주어진 시퀀스에 대해, 인접 노래들간의 불협 변화(dissonant transition), 특히 인접 노래들이 중복될 수 있는 상황들이 생길 수 있는, 시퀀스에서 인접 노래들간의 호환성이 명확히 해결되지 않았다는 것이다.
도 1은 복수의 오디오 신호들을 시퀀스에 순서화하는 방법의 흐름도.
도 2는 도 1의 방법에서 사용하기 위한 관련된 음악적 키들의 예시적인 세트를 나타내는 개략도.
도 3a 바로 후속하는 신호와 크로스페이딩된 현재 출력 신호를 나타내는 개략도.
도 3b는 오디오 신호의 크로스페이드 간격의 결정을 나타내는 개략도.
도 4는 복수의 오디오 신호들을 시퀀스에 순서화하는 시스템을 나타내는 개략도.
도 5는 복수의 오디오 신호들을 디지털 뮤직 주크박스로서 구현된 시퀀스에 순서화하는 도 4의 시스템의 제 1 응용을 나타내는 개략도.
도 6은 복수의 오디오 신호들을 네트워크 서비스 제공자에 의해 구현된 시퀀스에 순서화하는 도 4의 시스템의 제 2 응용을 나타내는 개략도.
본 발명의 목적은 공지된 기술을 개선하는 것이다.
본 발명에 따라,
- 사용자 선호도를 수신하는 단계;
- 고유의 특징들을 추출하기 위해 복수의 오디오 신호들을 분석하는 단계; 및
- 사용자 관여 없이, 시퀀스의 인접 오디오 신호들이 조화되도록, 추출된 특징들 및 사용자 선호도의 비교에 기초하여 복수의 오디오 신호들 중 적어도 2개의 오디오 신호들을 시퀀스에 순서화하는 단계를 포함하는, 복수의 오디오 신호들을 시퀀스에 순서화하는 방법이 제공된다.
다른 측면에 따라,
- 사용자 선호도를 수신하도록 동작 가능한 수신 디바이스;
- 오디오 신호들을 저장하도록 동작 가능한 스토어;
- 데이터 프로세서로서,
о 고유의 특징들을 추출하도록 복수의 오디오 신호들을 분석하고;
о사용자의 관여 없이, 시퀀스의 인접 신호들이 조화되도록, 추출된 특징들 및 사용자 선호도의 비교에 기초하여 복수의 오디오 신호들 중 적어도 2개의오디오 신호들을 시퀀스에 순서화하도록 동작 가능한, 상기 데이터 프로세서를 포함하는, 복수의 오디오 신호들을 시퀀스에 순서화하는 시스템이 제공된다.
본 발명으로 인해, 사용자 관여 없이 오디오 신호들을 시퀀스에 순서화하는 것이 가능하다. 오디오 신호들은 아날로그 또는 디지털일 수 있다.
유리하게는, 복수의 오디오 신호들은 사용자 선호도에 따라 식별된다. 적합하게는, 추출된 고유의 특징들은 음악적 키 및 베이스 노트 진폭을 포함하는 음악적 특징들이다. 바람직하게는, 시퀀스의 인접한 오디오 신호들은 관련된 음악적 키들을 갖는다. 이상적으로, 관련된 음악적 키들은 동일 템포 스케일에 따라 결정된다.
선택적으로, 방법은 시퀀스에 따라 예를 들어, 오디오 프리젠테이션으로서 적어도 2개의 오디오 신호들을 사용자에게 출력한다. 유리하게는, 현재 출력 신호는 연속적인 출력을 제공하도록, 시퀀스에서 바로 후속하는 신호와 크로스페이딩(crossfade)된다. 적합하게는, 크로스페이딩은 현재 신호 및 시퀀스에서 바로 후속하는 신호의 각 베이스 노트 진폭들에 의존하여 수행된다. 바람직하게는, 크로스페이드의 시간 간격동안, 각 오디오 신호의 베이스 노트 진폭은 각 오디오 신호의 최대 베이스 진폭의 1/7 이하이다.
본 발명의 이점은 인접 오디오 신호들의 부분들이 중복될 때에도 시퀀스의 인접 오디오 신호들간의 조화로운 변화가 존재한다는 것이다. 또한, 시퀀스는 사용자로부터의 최소의 노력으로 발생될 수 있다; 예를 들어, 사용자가 파티 또는 로맨틱한 오후용과 같은 이벤트들을 위한 오디오 신호들의 순서화된 콜렉션들을 편집하기 위해 단순한 인터페이스로 모드 또는 장르 스타일을 간단히 선택한다. 조화로운 변화를 재트레이닝하는 동시에, 본 발명은 예를 들어 음악적 키들에 따라 트랙들을 선택하고, 이에 의해 적합한 키 변화들이 시퀀스동안 이동되는 것을 허용함으로써, 시퀀스의 전체 프로파일에 따라 오디오 신호들을 순서화할 수 있다.
본 발명의 실시예들은 첨부 도면을 참조하여 단지 예로서 이제 기술될 것이다.
본 명세서에서 사용된 용어 '조화로운(harmonious)'은 시퀀스의 인접 오디오 신호들간의 충분한 호환성이 존재하여 인접한 오디오 신호들간의 변화가 조화롭게 된다는 의미이다. 적합하게는, 인접 오디오 신호들내에 포함된 일정한 특징들의 유사성은 조화에 기여하며; 이런 특징들의 예들로는 전달 피치, 전달 레벨, 및 전달 레이트가 있다.
도 1은 복수의 오디오 신호들을 시퀀스에 순서화하는 방법의 흐름도를 도시한다. 방법은 102에서 시작되고, 사용자 선호도는 104에서 수신된다. 복수의 오디오 신호들은 예를 들어, 저장매체, 서버 등과 같은 네트워크 엔티티를 경유하여 상기 방법에 현재 이용 가능한 모든 오디오 신호들이 될 수 있다. 선택적으로(점선으로 표시된) 복수의 오디오 신호들은 현재 이용 가능한 오디오 신호들의 서브셋이 되도록 식별된다(106). 이 서브셋은 예를 들어, 장르, 아티스트, 제목 등을 포함하는 분류에 따라 식별될 수 있다. 바람직하게는, 복수의 신호들은 사용자 선호도에 따라 식별된다. 사용자는 복수의 오디오 신호들을 수동으로 식별할 수 있으며, 바람직하게는, 식별은 사용자 선호도에 따라 자동으로 수행되고, 이에 의해 시간과 노력을 감소시킨다. 임의의 적절한 자동화된 식별은 예를 들어, 사용자 선호도에 따라 하나 이상의 분류들을 선택하고, 이 선택된 분류(들)에 기초하여 복수의 오디오 신호들을 식별하도록 사용된다. 본 출원인에 의해 출원된 영국 특허 출원 0303970.8(PHGB030014)에서, 오디오 신호들의 세트로부터 오디오 신호를 식별하는 방법이 개시된다. 오디오 신호들은 특징들을 추출하도록 분석된다. 그 후, 오디오 신호들은 사용자 선호도 및 추출된 특징들의 비교에 기초하여 식별된다.
복수의 오디오 신호들의 식별에 이어서, 방법은 복수의 오디오 신호들을 분석하여 고유의 특징들을 추출한다(108). 임의의 오디오 신호는 오디오 신호에 본질적으로 부착되거나 접속된 하나 이상의 특징들의 포함한다. 이러한 특징들은 본 명세서에서 '고유한'이라 하며, 예를 들어, 오디오 신호와 연관된 메타데이터와 구별되는데, 그 이유는 이러한 메타데이터는 그 연관된 오디오 신호와 구별되기 때문이다. 오디오 신호들의 고유한 특징들은 음악적 특징들을 포함한다. 특히, 방법은 이하에 더 논의되는 바와 같이 음악적 키, 음악적 템포 및 베이스 노트 진폭(bass note amplitude)과 비교하는 음악적 특징들을 추출 및 활용한다. 그 후, 방법은 추출된 특징들 및 사용자 선호도의 비교에 기초하여 복수의 오디오 신호들 중 적어도 2개의 오디오 신호들을 시퀀스에 순서화하여, 시퀀스의 인접한 신호들이 조화된다(110). 임의의 특정 예에서, 결과적인 시퀀스는 추출된 특징들과 사용자 선호도를 나타내는 특징들간의 일치에 의존하여 모든 복수의 오디오 신호들 또는 이들의 서브셋만을 포함할 수 있다. 사용자 선호도는 오디오 신호들의 추출된 특징들과의 비교에 사용하기에 적합한 임의의 정보를 포함한다. 이러한 정보의 예들로는 임의의 조합에서, 대표적 오디오 신호; 무드, 장르 아티스트등의 표시, 시퀀스에 대한 전반적인 프로파일이 있다.
시퀀스내에서, 인접한 오디오 신호들은 조화된다. 음악적 오디오 신호들에서, 조화로운(harmonious)은 인접한 오디오 신호들에 존재하는 특징들의 대응하는 형태들의 값들이 음악적으로 호환되어야 한다는 것을 의미한다. 일 예는 각 인접한 오디오 신호들 각각의 음악적 키가 관련된 경우이다. 본 출원인에 의해 출원된 영국 출원 0229940.2(PHGB020248)에서, 음악 트랙과 같은 오디오 신호의 키를 결정하는 방법이 개시된다. 오디오 신호의 부분은 분석되어 음악적 노트 및 각 부분내의 연관된 세기를 식별한다. 그 후, 제 1 노트는 그들 각각의 세기들의 기능으로서 식별된 음악적 노트들로부터 결정된다. 식별된 음악적 노트들로부터, 적어도 2개의 다른 노트들이 제 1 노트의 기능으로서 선택된다. 오디오 신호의 키는 그 후 선택된 노트들의 각 세기들의 비교에 기초하여 결정된다. 일단 오디오 신호들의 시퀀스가 결정되면, 방법은 선택적으로(점선에 의해 표시된 바와 같이) 시퀀스에 따라 적어도 2개의 오디오 신호들을 출력한다.
도 2는 도 1의 방법에서 사용하기 위한 관련된 음악적 키들의 예시적인 세트의 개략적인 표현을 도시한다. 도 1의 방법을 사용하여 시퀀스에 순서화된 오디오 신호들이 음악적 컨텐츠를 포함하는 경우, 바람직하게는 오디오 신호들의 순서화는 시퀀스의 인접 오디오 신호들이 조화되도록 배열되어 그들 각자의 음악적 키들이 관련된다. 이상적으로, 관련된 음악적 키들은 대부분의 서부 음악에서 흔한 동일 템포 스케일(Equal Tempered Scale)에 따라 결정된다. 도 2는 동일 템포 스케일의 키들의 일부를 도시한다. 메이저 키들(major keys)은 214, 204, 202, 206, 218을 포함하는 열(row)에서 나타나고, 마이너 키들(minor keys)은 216, 210, 208, 212, 220을 포함하는 열에서 나타난다.
오디오 신호들의 특정 시퀀스내의 오디오 신호는 C 메이저의 키의 음악 트랙이라 고려된다. 도 2에서, 점선(200)은 음악 이론에 의해 C 메이저의 키에 근접하게 관련되도록 결정되는 모든 키들의 동일 템포 스케일을 포함한다. C 메이저 신호에 인접한 오디오 신호가 음악 트랙이라 가정하면, 바람직하게는 이 인접한 신호는 동일하거나, 이 예에서 점선(200)에 포함된 즉 F 메이저(204), C 메이저(202), G 메이저(206), D 마이너(210), A 마이너(208) 또는 E 마이너(212) 키들 중 임의의 하나를 포함하는 근접하게 관련된 키이다. 인접 신호가 키 D 마이너(210)를 갖는다 가정하면, D 마이너 신호에 다음 인접한 오디오 신호의 키(이 다음 신호는 음악 트랙이 가정하면)는 동일하거나 근접하게 관련되고, 따라서, 키들 즉, G 마이너(216), D 마이너(210), A 마이너(208), Bb 메이저(214), F 메이저(204) 또는 C 메이저(202) 중 임의의 하나에 있다. 관련된 음악적 키들 이외에, 예를 들어 음악적 템포 및 베이스 노트 진폭과 같은 다른 특징들은 시퀀스의 인접 신호들이 조화된다는 것을 보장하기 위해 사용될 수 있다.
도 3a는 시퀀스에서 바로 후속하는 신호와 크로스페이딩된 현재 출력 신호의 개략적인 표현을 도시한다. 크로스페이딩은 신호들이 혼합되는 시간의 기간동안 출력된 시퀀스의 인접 오디오 신호들을 중복함으로써 오디오 신호들의 연속적 출력을 허용한다. 제 1 오디오 신호(302) 및 제 2 오디오 신호(304)는 시퀀스에서 연속적인 신호들이다. 제 1 신호(302)가 출력될 때, 제 2 오디오 신호(304)와의 크로스페이딩은 시간의 어떤 지점(306)에서 시작하고 그 후, 차후의 시간(308)에서 완료되어, 이 시간 이후에, 제 2 오디오 신호(304)만이 출력되며; 크로스페이딩의 존속기간이 310에서 도시된다. 크로스페이딩은 시퀀스에서 현재 신호 및 바로 후속하는 신호의 각 베이스 노트 진폭들에 의존하여 수행될 수 있다. 이는, 이들 신호들의 템포들이 일치하지 않을 때, 크로스페이딩은 두 신호들이 유효 베이스 진폭을 갖지 않는 기간동안 발생하는 것이 바람직하기 때문이며, 각 오디오 신호의 베이스 진폭은 각 오디오 신호의 최대 베이스 진폭의 1/7보다 적을 때가 적합하다.
도 3b는 오디오 신호에 대한 크로스페이드 간격의 결정의 대략적인 표현을 도시한다. '크로스페이드 간격'은 다른 적합한 신호를 갖는 크로스페이드가 바람직하게 수행되는 오디오 신호내의 시간 간격이다. 통상적으로, 오디오 신호는 적어도 2개의 이런 간격을 가지며, 하나는 실질적으로 시작부에 있고, 다른 하나는 실질적으로 신호의 말단부에 있으며; 크로스페이드 간격들은 신호의 다른 곳에서 식별 가능하게 될 수도 있다. 도 3b는 오디오 신호의 베이스 노트 진폭에 따라 오디오 신호의 크로스페이드 간격의 결정을 도시한다. 박스들(320, 324)은 오디오 신호들의 진폭 응답 곡선들(322, 326)을 각각 도시한다(스케일링되지 않음). 곡선(322)은 예를 들어 50 - 20,000 Hz인 오디오 신호내의 오디오 주파수 범위에 대해 최대 진폭들의 시간(수평축상의)에 대한 파일롯을 나타낸다. 곡선(326)은 예를 들어 베이스 주파수들(50 - 600 Hz)인 오디오 주파수의 서브-범위에 대해 최대 진폭들의 시간에 대한 파일롯을 나타낸다. 시간점(328)은 오디오 신호의 청취가능 부분의 시작을 나타내며, 이는 진폭이 0을 이상으로 상승하는 지점이 된다. 시간점(330)은 오디오 신호의 청취가능 부분의 유효 베이스 컨텐츠의 시작을 나타내며, 이는, 베이스 진폭이 오디오 신호의 최대 베이스 진폭의 미리 결정된 양(334)보다 큰 지점이 된다. 이는 오디오 신호에 대해 적합한 미리 결정된 양(334)이 그 최대 베이스 진폭의 1/7이라는 것을 알 수 있다. 시간 간격(332)(지점들(328과 330)간의)은 크로스페이드가 발생할 수 있는 최대 간격을 나타낸다(이 도시된 예에서, 오디오 신호의 시작부분동안). 임의의 2개의 적합한 오디오 신호들이 주어지면, 그들 사이의 크로스페이딩이 가능한 신호들 각각의 하나 이상의 이런 간격들이 결정될 수 있다.
도 4는 복수의 오디오 신호들의 시퀀스에 순서화하는 시스템의 개략적인 표현이 도시된다. 시스템은 데이터 프로세서(400), 수신 디바이스(406) 및 스토어(408)를 포함하며, 모두는 데이터 및 통신 버스(410)를 통해 상호 접속된다. 선택적으로(도 4의 점선으로 도시된), 시스템은 오디오 입력 디바이스(402) 및 출력 디바이스(404)를 또한 포함하며, 이들 또한 버스(410)에 접속된다. 데이터 프로세서는 비휘발성 프로그램 저장공간(416)에 수용된 소프트웨어 프로그램의 제어 하에서 실행하고, 프로그램 실행의 일시적인 결과를 수용하기 위한 휘발성 저장공간(418)을 사용하는 CPU(412)를 포함한다. 데이터 프로세서는 특징들을 추출하도록 오디오 신호들을 분석하기 위해 사용되는 오디오 신호 분석기(414)를 또한 포함하며, 대안적으로, 이 기능은 소프트웨어 제어하에서 CPU에 의해 수행될 수 있다. 스토어(408)는 통상적으로 예를 들어, 사용자의 전체 음악적 라이브러리와 같은 많은 오디오 신호들을 저장한다. 스토어에 수용된 복수의 오디오 신호들을 포함하는 모두 또는 부분(서브셋)은 분석되며; 분석되기 위해 복수의 저장된 오디오 신호들의 식별은 앞서 논의된바와 같이, 사용자 선호도에 따라 데이터 프로세서(400)에 의해 결정될 수 있다. 물론, 오디오 신호들이 분석되고, 그 후 사용자 관여없이, 2개 이상이 추출된 특징들 및 사용자 선호도의 비교에 기초하여 시퀀스에 차례로 순서화되어, 시퀀스의 인접 신호들이 조화된다. 수신 디바이스(406)는 사용자 선호도를 수신할 수 있는 임의의 적합한 디바이스이며, 예들은 사용자 인터페이스 및 네트워크 인터페이스를 포함한다. 후자는 유선 또는 무선일 수 있다(일 예는 도 6이 관련하에 이하에 기술됨). 사용자 선호도는 단순한 지시에서 예를 들어, 분석될 복수의 오디오 신호들의 무드(mood), 테마 및/또는 아이덴티티를 지정하는 보다 복잡한 선호도일 수 있다. 선택적으로, 오디오 입력 디바이스(402)는 데이터 프로세서(400)가 차후에 스토어(408)에 저장하도록 배열되는 오디오 신호들을 수신하기 위해 사용될 수 있다. 오디오 신호들을 수신할 수 있는 접합한 오디오 입력 디바이스들의 예들로는 방송 무선 튜너들(예컨대, AM, FM, 케이블, 위성), 인터넷 액세스 디바이스(예컨대, PC내의 인터넷 브라우저 수단), 유선 또는 무선 네트워크 인터페이스(예컨대, 컴퓨터 네트워크 및 인터넷에 액세스하기 위한) 및 모뎀들(예컨대, 케이블, 다이얼-업, 브로드밴드 등)을 포함한다. 또한, 선택적으로, 데이터 프로세서(400)의 제어하에서, 시퀀스에 따라 복수의 오디오 신호들 중 적어도 2개의 오디오 신호들을 차후에 출력하는 출력 디바이스(404)는 시스템에 제공된다. 출력 신호들은 아날로그 또는 디지털 포맷들일 수 있다. 바람직하게는, 출력 디바이스(404)는 현재 출력 신호를 시퀀스에서 바로 후속하는 신호와 크로스페이드할 수 있다. 대안적으로, 출력 디바이스의 기능들은 데이터 프로세서(400)에 의해 수행될 수 있다.
도 5는 500에서 전체적으로 도시되는 디지털 뮤지 주크박스로서 구현된, 복수의 오디오 신호들을 시퀀스에 순서화하는 도 4의 시스템의 제 1 응용의 개략적인 표현을 도시한다. 주크박스는 사용자 인터페이스(508)로부터 사용자 선호도(510)를 수신하는 프로세서(502)를 포함한다. 사용자 인터페이스는 예를 들어, '파티','로맨틱' 또는 어떤 다른 미리 결정된 선호도와 같은 프리셋 장르 형태를 선택하기 위해 키패드상에서의 단순 누름에 의해 사용자가 사용자 선호도를 입력하는 것을 허용할 수 있다. 이러한 사용자 인터페이스는 휴대용 제품들에서, 사용의 용이성 및 간결한 구현을 허용한다. 수신된 사용자 선호도에 응답하여, 프로세서(502)는 라이브러리(504)로부터 오디오 신호들(506)을 판독하고, 앞서 논의된 바와 같이 분석 및 순서화를 수행하며, 오디오 신호들(512)을 프로세서(502)의 제어하에서 오디오 신호들의 프로스페이딩을 수행하는 출력 디바이스(514)에 출력한다. 오디오 신호 입력 디바이스로서 작동하는 인터페이스(518)는 예를 들어 외부 PC 또는 튜너와 같은 주크박스 외부의 소스들로부터 오디오 신호들을 더 수신하도록 사용될 수 있다. 적합한 인터페이스들의 예들은 RS232, 이더넷, USB, FireWire, S/PDIF와 같은 유선 인터페이스들 및 IrDA, 블루투스, ZigBee, IEEE802,11, 하이퍼LAN과 같은 무선 인터페이스들을 포함한다. 오디오 신호들은 아날로그 또는 디지털일 수 있다. 적합한 디지털 오디오 신호 포맷들의 예들은 AES/EBU, CD 오디오, WAV, AIFF 및 MP3를 포함한다. 보다 복잡한 사용자 선호도들의 결정은 인터페이스(518)를 통해 주크박스(500)에 접속 가능한 PC와 같은 다른 제품의 사용자 인터페이스를 이용함으로써 또한 가능하며; 사용자 선호도는 이 경우에 수신 디바이스로서 작동하는 상기 인터페이스를 사용하여 주크박스 내로 로딩될 수 있다. 그러므로, 인터페이스를 통해 이동되는 컨텐츠(516)는 오디오 신호들 및/또는 사용자 선호도를 포함할 수 있다. 또한, 인터페이스(518)는 상술한 바와 같은, IrDA(예컨대, 사용자 선호도를 운송하기 위한)와 아날로그 오디오의 조합과 같은 하나 이상의 인터페이스 형태에 의해 구현될 수 있으며; 대안적으로, 단일 인터페이스(예컨대, USB)가 외부 시스템으로부터 주크박스로 오디오 신호 및 사용자 선호도들의 전달을 지원할 수 있다.
도 6은 네트워크 서비스 제공자에 의해 구현된, 복수의 오디오 신호들을 시퀀스에 순서화하는 도 4의 시스템의 제 2 응용의 개략적인 표현을 도시한다. 사용자 선호도(624)에 응답하여, 시스템(602)은 오디오 입력 디바이스(610)(앞서 기술된 방송 및 네트워크 전달 수단을 통해 소스들로부터 오디오 신호들을 수신하도록 작동 가능한 오디오 신호 라이브러리(612) 및 튜너들(615)로 구성된)로부터 오디오 신호들(616)을 판독할 수 있다. 서버(606)는 오디오 신호들을 분석 및 순서화하고, 이들을 서버(606)의 제어하에서 오디오 신호들의 크로스페이딩을 수행하고, 출력 신호를 PC/pda(630) 또는 라디오(628)와 같은 최종 사용자 장비에 의해 수신 및 최종 사용자 장비로 전달하기에 적합한 포맷(예컨대, TCP/IP를 통한 HTTP 또는 RF 변조)으로 변환하는 출력 디바이스(608)에 포워딩한다. 이런 방식으로 서비스 제공자는 사용자 선호도(624)에 따라 오디오 신호들의 순서화된 시퀀스(626)를 발생 및 출력할 수 있다. 이러한 사용자 선호도는 서비스 제공자에 의해 수신된 개별 선호도들의 세트로부터 유도된 개별적 또는 집합적 선호도일 수 있으며; 후자의 시나리오는 예를 들어 무선 방송을 통해 최종 사용자들로 오디오 신호들의 시퀀스를 전달하는데 이용 가능한 대역폭이 제한된 경우에 특히 유용하다. 이 예에서, 사용자는 모바일 전화(618)를 사용하여 선호도를 결정하고; 그 후, 선호도는 GSM 네트워크(622)를 통해 SMS 메시지(620)로서 포워딩된다. 서비스 제공자는 GSM 수신기(604)를 사용하여 SMS 메시지를 수신하고; GSM 수신기에 의해 SMS 메시지를 디코딩한 후에, 사용자 선호도(624)는 서버(606)에 포워딩된다.
상기 방법 및 구현은 단지 예로서 제공되었고, 본 발명의 이점을 이용하도록 당업자에 의해 쉽게 식별될 수 있는 방법들 및 구현들의 범위의 선택을 나타낸다.
상기 기술 및 도 1을 참조하여, 사용자 선호도를 수신(104)하고, 고유의 특징들을 추출하기 위해 복수의 오디오 신호들을 분석(108)하며, 사용자 관여없이, 시퀀스의 인접 신호들의 조화되도록, 추출된 특징들 및 사용자 선호도의 비교에 기초하여 복수의 오디오 신호들 중 적어도 2개를 시퀀스에 순서화(110)하는 것을 포함하는 복수의 오디오 신호들을 시퀀스에 순서화하는 방법이 개시된다. 복수의 오디오 신호들은 사용자 선호도에 따라 식별(106)될 수 있다. 순서화된 오디오 신호들은 출력(112)될 수 있다.

Claims (17)

  1. 복수의 오디오 신호들을 시퀀스에 순서화(ordering)하는 방법으로서,
    - 사용자 선호도를 수신하는 단계(104);
    - 고유의 특징들을 추출하기 위해 상기 복수의 오디오 신호들을 분석하는 단계(108); 및
    - 사용자 관여 없이, 시퀀스의 인접 오디오 신호들이 조화되도록, 상기 추출된 특징들 및 상기 사용자 선호도의 비교에 기초하여, 상기 복수의 오디오 신호들 중 적어도 2개의 오디오 신호들을 상기 시퀀스에 순서화하는 단계(110)를 포함하는, 순서화 방법.
  2. 제 1 항에 있어서,
    상기 복수의 오디오 신호들은 상기 사용자 선호도에 따라 식별(106)되는, 순서화 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 추출된 고유의 특징들은 음악적 특징들인, 순서화 방법.
  4. 제 3 항에 있어서,
    상기 시퀀스의 인접 오디오 신호들은 관련된 음악적 키들(keys)을 갖는, 순서화 방법.
  5. 제 4 항에 있어서,
    상기 관련된 음악적 키들(200)은 동일 템포 스케일(Equal Tempered Scale)에 따라 결정되는, 순서화 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 시퀀스에 따라 상기 적어도 2개의 오디오 신호들을 출력(112)하는 단계를 더 포함하는, 순서화 방법.
  7. 제 6 항에 있어서,
    현재 출력 신호(302)는 연속적인 출력을 제공하도록, 상기 시퀀스에서 바로 후속하는 신호(304)와 크로스페이딩(crossfade)되는, 순서화 방법.
  8. 제 7 항에 있어서,
    상기 크로스페이딩은 상기 시퀀스에서 상기 현재 신호 및 상기 바로 후속하는 신호의 각 베이스 노트 진폭들(bass note amplitudes)에 의존하는, 순서화 방법.
  9. 제 8 항에 있어서,
    상기 크로스페이드의 시간 간격 동안, 각 오디오 신호의 상기 베이스 노트 진폭은 상기 각 오디오 신호의 최대 베이스 진폭의 1/7이하인, 순서화 방법.
  10. 복수의 오디오 신호를 시퀀스에 순서화하는 시스템으로서,
    - 사용자 선호도를 수신하도록 동작 가능한 수신 디바이스(406);
    - 오디오 신호들을 저장하도록 동작 가능한 스토어(408);
    - 데이터 프로세서(400)로서,
    о 고유의 특징들을 추출하도록 상기 복수의 오디오 신호들을 분석하고;
    о사용자의 관여 없이, 시퀀스의 인접 신호들이 조화되도록, 상기 추출된 특징들 및 사용자 선호도의 비교에 기초하여, 상기 복수의 오디오 신호들 중 적어도 2개의 오디오 신호들을 상기 시퀀스에 순서화하도록 동작 가능한, 상기 데이터 프로세서를 포함하는, 순서화 시스템.
  11. 제 10 항에 있어서,
    상기 프로세서(400)는 상기 사용자 선호도에 따라 상기 복수의 오디오 신호들을 식별하도록 동작 가능한, 순서화 시스템.
  12. 제 10 항 또는 제 11 항에 있어서,
    오디오 신호들을 수신하도록 동작 가능한 오디오 입력 디바이스(402)를 더 포함하고, 상기 데이터 프로세서(400)는 상기 수신된 오디오 신호들을 저장하도록 동작 가능한, 순서화 시스템.
  13. 제 10 항 내지 제 12 항 중 어느 한 항에 있어서,
    상기 시퀀스에 따라 상기 복수의 오디오 신호들 중 상기 적어도 2개의 오디오 신호들을 출력하도록 동작 가능한 출력 디바이스(404)를 더 포함하고, 상기 데이터 프로세서(400)는 상기 출력 디바이스를 제어하도록 동작 가능한, 순서화 시스템.
  14. 제 13 항에 있어서,
    상기 출력 디바이스는 현재 출력 신호를 상기 시퀀스에서 상기 바로 후속하는 신호와 크로스페이딩하도록 동작 가능한, 순서화 시스템.
  15. 제 1 항 내지 제 9 항 중 어느 한 항에 따른 방법을 실행하도록 동작 가능한 소프트웨어를 포함하는 기록 캐리어.
  16. 제 1 항 내지 제 9 항 중 어느 한 항에 청구된 바와 같은 상기 방법 단계들을 실행하도록 구성된 소프트웨어 유틸리티.
  17. 데이터 프로세서를 포함하는 시스템으로서, 상기 데이터 프로세서는 제 16 항에 청구된 바와 같은 소프트웨어 유틸리티에 의해 그 동작들이 관리되는, 시스템.
KR1020057011616A 2002-12-20 2003-12-10 오디오 신호들의 순서화 KR20050088132A (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GBGB0229940.2A GB0229940D0 (en) 2002-12-20 2002-12-20 Audio signal analysing method and apparatus
GB0229940.2 2002-12-20
GBGB0303970.8A GB0303970D0 (en) 2002-12-20 2003-02-21 Audio signal identification method and system
GB0303970.8 2003-02-21
GB0307474.7 2003-04-01
GBGB0307474.7A GB0307474D0 (en) 2002-12-20 2003-04-01 Ordering audio signals

Publications (1)

Publication Number Publication Date
KR20050088132A true KR20050088132A (ko) 2005-09-01

Family

ID=32685759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057011616A KR20050088132A (ko) 2002-12-20 2003-12-10 오디오 신호들의 순서화

Country Status (6)

Country Link
US (1) US20060112810A1 (ko)
EP (1) EP1579420A1 (ko)
JP (1) JP2006511845A (ko)
KR (1) KR20050088132A (ko)
AU (1) AU2003285630A1 (ko)
WO (1) WO2004057570A1 (ko)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7592534B2 (en) * 2004-04-19 2009-09-22 Sony Computer Entertainment Inc. Music composition reproduction device and composite device including the same
JP2009510658A (ja) * 2005-09-30 2009-03-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオを再生用に処理する方法および装置
WO2007105180A2 (en) * 2006-03-16 2007-09-20 Pace Plc Automatic play list generation
US7956274B2 (en) * 2007-03-28 2011-06-07 Yamaha Corporation Performance apparatus and storage medium therefor
JP4311466B2 (ja) * 2007-03-28 2009-08-12 ヤマハ株式会社 演奏装置およびその制御方法を実現するプログラム
US8026436B2 (en) * 2009-04-13 2011-09-27 Smartsound Software, Inc. Method and apparatus for producing audio tracks
US8757523B2 (en) 2009-07-31 2014-06-24 Thomas Valerio Method and system for separating and recovering wire and other metal from processed recycled materials
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9299331B1 (en) * 2013-12-11 2016-03-29 Amazon Technologies, Inc. Techniques for selecting musical content for playback
US9343054B1 (en) * 2014-06-24 2016-05-17 Amazon Technologies, Inc. Techniques for ordering digital music tracks in a sequence
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
CN107480161A (zh) * 2016-06-08 2017-12-15 苹果公司 用于媒体探究的智能自动化助理
US10049663B2 (en) * 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5295123A (en) * 1990-11-14 1994-03-15 Roland Corporation Automatic playing apparatus
US5693902A (en) * 1995-09-22 1997-12-02 Sonic Desktop Software Audio block sequence compiler for generating prescribed duration audio sequences
JP2927229B2 (ja) * 1996-01-23 1999-07-28 ヤマハ株式会社 メドレー演奏装置
JP2956569B2 (ja) * 1996-02-26 1999-10-04 ヤマハ株式会社 カラオケ装置
JP3799761B2 (ja) * 1997-08-11 2006-07-19 ヤマハ株式会社 演奏装置、カラオケ装置および記録媒体
JP3551087B2 (ja) * 1999-06-30 2004-08-04 ヤマハ株式会社 楽曲自動再生装置および連続楽曲情報作成再生プログラムを記録した記録媒体
US6933432B2 (en) * 2002-03-28 2005-08-23 Koninklijke Philips Electronics N.V. Media player with “DJ” mode

Also Published As

Publication number Publication date
WO2004057570A1 (en) 2004-07-08
AU2003285630A1 (en) 2004-07-14
US20060112810A1 (en) 2006-06-01
JP2006511845A (ja) 2006-04-06
EP1579420A1 (en) 2005-09-28

Similar Documents

Publication Publication Date Title
KR20050088132A (ko) 오디오 신호들의 순서화
US6748360B2 (en) System for selling a product utilizing audio content identification
US9398390B2 (en) DJ stem systems and methods
US8751030B2 (en) Audio player and operating method automatically selecting music type mode according to environment noise
US20110112672A1 (en) Systems and Methods of Constructing a Library of Audio Segments of a Song and an Interface for Generating a User-Defined Rendition of the Song
US20100125351A1 (en) Ordering A Playlist Based on Media Popularity
KR20070094487A (ko) 메타데이터 부여 방법 및 장치
KR20060109839A (ko) 재생장치, 재생 제어 방법 및 프로그램
US11762901B2 (en) User consumption behavior analysis and composer interface
US6965546B2 (en) Sound critical points retrieving apparatus and method, sound reproducing apparatus and sound signal editing apparatus using sound critical points retrieving method
CN1729507A (zh) 对音频信号进行排序
KR20070058247A (ko) 오디오 컨텐츠 선택 정보 제공 방법 및 장치와 그 방법을수행하는 프로그램이 기록된 기록매체
JP2009266083A (ja) 試聴用コンテンツ配信システムおよび端末装置
US20070133357A1 (en) User aware audio playing apparatus and method
CN108628886A (zh) 一种音频文件推荐方法及装置
JP2002073041A (ja) 自動選曲システム、自動選曲方法、及び記憶媒体
KR101547525B1 (ko) 사용자의 입력을 반영한 자동 음악 선곡 장치 및 방법
JP2003005756A (ja) 電子機器における音楽ファイルデータの再生、配信、放送時に、希望する曲調の時間的変化を伴った選曲順リスト自動生成と、その再生・配信システム。
US20110125297A1 (en) Method for setting up a list of audio files
WO2004057861A1 (en) Audio signal identification method and system
CN100471205C (zh) 具有音响自动设定功能的移动通信终端及方法
US20130346860A1 (en) Media compliation system
JP2005276322A (ja) 楽曲データ格納装置および楽曲再生順序設定方法
KR20070023277A (ko) 수신된 메시지에 의해 콘텐츠 재생목록을 결정하는이동통신 단말기
JP2012032675A (ja) 配信デジタル音楽データ記録システム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application