KR20110125968A - Method and system for managing music data classification model - Google Patents

Method and system for managing music data classification model Download PDF

Info

Publication number
KR20110125968A
KR20110125968A KR1020100045627A KR20100045627A KR20110125968A KR 20110125968 A KR20110125968 A KR 20110125968A KR 1020100045627 A KR1020100045627 A KR 1020100045627A KR 20100045627 A KR20100045627 A KR 20100045627A KR 20110125968 A KR20110125968 A KR 20110125968A
Authority
KR
South Korea
Prior art keywords
sound source
classification
classification model
information
terminal
Prior art date
Application number
KR1020100045627A
Other languages
Korean (ko)
Inventor
김재은
임우영
김문식
김효민
안재석
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020100045627A priority Critical patent/KR20110125968A/en
Publication of KR20110125968A publication Critical patent/KR20110125968A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: A sound source classification model management method and system thereof are provided to improve a sound source classification model by collecting classification result information about the sound sources from a sound source classification terminal. CONSTITUTION: A classification model providing unit(120) transmits sound source classification information to a sound source classification terminal based on a property information by responding the request of the sound source classification terminal. The property information includes information about the rhythm, waveform, and tone color of the sound source. A classification model management unit(130) creates the first sound source classification model using the first sound source classification model. The classification model management creates a second sound source classification model based on the information of the sound source.

Description

음원 분류 모델 관리 방법 및 시스템{METHOD AND SYSTEM FOR MANAGING MUSIC DATA CLASSIFICATION MODEL}Sound source classification model management method and system {METHOD AND SYSTEM FOR MANAGING MUSIC DATA CLASSIFICATION MODEL}

본 발명은 음원 분류 모델을 관리하는 방법 및 시스템에 관한 것으로서, 보다 상세하게는, 음원을 특성에 따라 자동으로 분류하는 음원 분류 모델을 관리하는 방법 및 시스템에 관한 것이다.
The present invention relates to a method and system for managing a sound source classification model, and more particularly, to a method and system for managing a sound source classification model for automatically classifying sound sources according to characteristics.

최근 디지털 음악의 압축기술과 데이터 통신 인프라의 발달로 인하여 음반 산업의 중심이 기존의 물리적 매체에서 디지털 음원으로 이동하고 있으며, 디지털 음원 재생 장치도 또한 기존의 데스크탑 등 컴퓨터(computer)뿐만 아니라 디지털 음원 전용 재생 장치, PMP(Portable Multimedia Player), 스마트폰 등의 휴대용 장치까지 점차 다양화 되어가고 있다.Recently, due to the development of digital music compression technology and data communication infrastructure, the center of the music industry is shifting from the existing physical media to the digital sound source, and the digital sound source playback device is also dedicated to digital sound sources as well as computers such as the existing desktop. Increasingly, portable devices such as playback devices, portable multimedia players (PMPs), and smart phones are being diversified.

이러한 발달로 인하여 개인이 소장하는 디지털 음원의 수는 빠르게 증가하고 있으며, 기존의 물리적 매체와 달리 다양한 경로를 통해 생산되는 음원들을 효과적이고 체계적으로 관리해야 할 필요성이 대두되고 있다.Due to this development, the number of digital sound sources owned by individuals is increasing rapidly, and unlike the existing physical media, there is a need for effective and systematic management of sound sources produced through various paths.

이러한 필요에 의해 자동으로 음악의 장르를 분류해 주는 기술들이 많이 연구되어 있으며, 특히 통계적 기법을 음악의 장르를 분류하는 기술이 많이 연구되고 있다.Due to these needs, many techniques for automatically classifying music genres have been studied. In particular, many techniques for classifying music genres with statistical techniques have been studied.

그러나 종래의 통계적 방법을 이용하여 음악 장르를 분류하는 방법은 분류 시스템을 훈련시키기 위한 많은 양의 훈련 데이터 집합을 요구한다. 또한, 각각의 훈련데이터가 전문가에 의해 정확한 기준으로 분류되는 과정을 통해 분류 시스템이 훈련될 수 있다. 따라서, 종래의 음원 장르 분류 방법은 대규모 음원을 다루고 판매하는 사업자가 아닌 소규모의 음원만을 소유하고 있는 개인 사용자가 사용하기에 적합하지 않는 문제점이 있었다.
However, conventional methods of classifying music genres using statistical methods require a large amount of training data sets to train the classification system. In addition, the classification system may be trained through a process in which each training data is classified by an expert on an accurate basis. Therefore, the conventional sound source genre classification method has a problem that it is not suitable for use by an individual user who owns only a small sound source, not a business dealing with and selling a large sound source.

본 발명의 일 실시예는 사용자가 기본적으로 사용할 수 있는 음원 분류 모델을 제공하고, 하나 이상의 사용자의 단말로부터 분류된 결과를 수집하여 기존의 음원 분류 모델을 점진적으로 개선시킬 수 있는 음원 분류 모델 관리 방법 및 시스템을 제공하고자 한다.One embodiment of the present invention provides a sound classification classification model that can be used by the user basically, and collects the results classified from the terminal of one or more users to gradually improve the existing sound classification classification model method And to provide a system.

또한, 본 발명의 일 실시예는 사용자 단말에서 분류된 결과에 대하여 사용자로부터 수정 요청에 의한 피드백(feedback)을 수신하고, 이러한 피드백이 적용된 결과를 수집하여 기존의 음원 분류 모델을 개선시킴으로써 보다 신뢰성이 있는 음원 분류 모델을 생성하고 관리할 수 있는 음원 분류 모델 관리 방법 및 시스템을 제공하고자 한다.
In addition, an embodiment of the present invention is more reliable by receiving a feedback by the user request for a correction for the results classified in the user terminal, collecting the results applied to this feedback to improve the existing sound classification classification model The present invention provides a sound source classification model management method and system for creating and managing sound source classification models.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면은 (a) 음원의 음색, 리듬 및 파형에 대한 정보를 포함하는 특징 정보에 기초하여 음원을 분류하는 제 1 음원 분류 모델을 미리 수집한 음원을 이용하여 생성하는 단계, (b) 하나 이상의 음원 분류 단말로부터 음원 분류 모델에 대한 요청을 수신하고, 상기 요청에 응답하여 상기 제 1 음원 분류 모델을 상기 음원 분류 단말로 전송하는 단계, (c) 상기 음원 분류 단말로부터 상기 제 1 음원 분류 모델을 이용하여 분류된 음원의 정보를 수신하는 단계 및 (d) 상기 제 1 음원 분류 모델에 포함된 데이터 및 상기 분류된 음원의 정보를 모두 포함하는 제 2 음원 분류 모델을 생성하는 단계를 포함하는 음원 분류 모델 관리 서버가 음원 분류 모델을 관리하는 방법을 제공할 수 있다.As a technical means for achieving the above-described technical problem, the first aspect of the present invention (a) a first sound source classification model for classifying a sound source based on the characteristic information including information on the tone, rhythm and waveform of the sound source Generating using a previously collected sound source, (b) receiving a request for a sound source classification model from at least one sound source classification terminal, and transmitting the first sound source classification model to the sound source classification terminal in response to the request (c) receiving information of sound sources classified using the first sound source classification model from the sound source classification terminal, and (d) both data included in the first sound source classification model and information of the classified sound sources. The sound source classification model management server including generating a second sound source classification model may include a method of managing the sound source classification model.

본 발명의 제 1 측면에서, 상기 (b) 단계는 (b1) 상기 음원 분류 단말이 상기 제 1 음원 분류 모델을 수신하는 단계, (b2) 상기 음원 분류 단말이 분류 대상 음원의 특징 정보를 획득하는 단계, (b3) 상기 음원 분류 단말이 상기 음원의 특징 정보를 상기 제 1 음원 분류 모델에 적용하여 상기 음원을 분류하는 단계, (b4) 상기 음원 분류 단말이 상기 음원의 분류 결과에 대한 수정 요청을 수신하는 경우, 상기 수정 요청을 반영하여 상기 음원의 분류 결과를 수정하는 단계 및 (b5) 상기 음원 분류 단말이 상기 분류 결과를 상기 분류된 음원의 정보에 저장하는 단계를 포함할 수 있다.In the first aspect of the invention, the step (b) is (b1) the sound classification terminal receives the first sound source classification model, (b2) the sound source classification terminal to obtain the characteristic information of the sound source to be classified; (B3) the sound classification terminal applying the characteristic information of the sound source to the first sound source classification model to classify the sound source, (b4) the sound classification terminal making a request for modification of the classification result of the sound source When receiving, the method may include modifying the classification result of the sound source in response to the modification request, and (b5) storing the classification result in the classified sound source information by the sound source classification terminal.

또한, 본 발명의 제 2 측면은 음원 분류 단말의 요청에 응답하여 음원의 음색, 리듬 및 파형에 대한 정보를 포함하는 특징 정보에 기초하여 음원을 분류하는 제 1 음원 분류 모델을 상기 음원 분류 단말로 전송하는 분류 모델 제공부 및 미리 수집한 음원을 이용하여 상기 제 1 음원 분류 모델을 생성하고, 상기 음원 분류 단말로부터 수신한 상기 제 1 음원 분류 모델을 이용하여 분류된 음원의 정보를 기초로 제 2 음원 분류 모델을 생성하는 분류 모델 관리부를 포함하고, 상기 제 2 음원 분류 모델은 상기 제 1 음원 분류 모델에 포함된 데이터 및 상기 분류된 음원의 정보를 모두 포함하는 음원 분류 모델을 관리하는 음원 분류 모델 관리 시스템을 제공할 수 있다.In addition, the second aspect of the present invention to the sound source classification terminal a first sound source classification model for classifying the sound source based on the feature information including information on the tone, rhythm and waveform of the sound source in response to a request of the sound source classification terminal The first sound source classification model is generated using a classification model providing unit to transmit and a previously collected sound source, and the second sound source is classified based on information of sound sources classified using the first sound source classification model received from the sound source classification terminal. A sound source classification model for managing a sound source classification model that includes a classification model manager configured to generate a sound source classification model, wherein the second sound source classification model includes both data included in the first sound source classification model and information about the classified sound sources; A management system can be provided.

본 발명의 제 2 측면에서, 상기 음원 분류 단말은 상기 제 1 음원 분류 단말을 이용하여 분류 대상 음원을 분류하는 음원 분류부, 상기 음원 분류부에 의한 분류 결과를 상기 분류 대상 음원의 정보에 포함시키는 음원 정보 갱신부 및 상기 분류 결과에 대해 수신한 사용자의 수정 요청이 반영되도록 상기 분류 대상 음원의 정보를 수정하는 사용자 수정 적용부를 포함하고, 상기 분류 대상 음원의 정보는 음원 식별 정보 필드, 특징 정보 필드 및 분류 범주 필드를 포함할 수 있다.
In a second aspect of the present invention, the sound source classification terminal includes a sound source classification unit for classifying a sound source to be classified using the first sound source classification terminal, and including the result of classification by the sound source classification unit in the information of the sound source to be classified. A sound source information updating unit and a user modification application unit for modifying information of the sound source to be classified so that the user's request for correction is reflected on the classification result, wherein the sound source information includes: a sound source identification information field and a feature information field And a classification category field.

전술한 본 발명의 과제 해결 수단에 의하면, 하나 이상의 음원 분류 단말로부터 기존의 음원 분류 모델에 의한 분류 결과를 수신하고, 수신한 분류 결과를 기존의 음원 분류 모델에 반영시켜 음원 분류 모델을 훈련시키고 업그레이드(upgrade)시킬 수 있다. 따라서, 별도로 대규모의 음원 데이터를 수집하지 않더라도 하나 이상의 음원 분류 단말로부터 다양한 음원에 대한 하나 이상의 분류 결과 정보를 수집하여 점진적으로 음원 분류 모델을 향상시킬 수 있다.According to the above-described problem solving means of the present invention, by receiving the classification result by the existing sound source classification model from at least one sound source classification terminal, and reflects the received classification result in the existing sound source classification model to train and upgrade the sound source classification model can be upgraded. Therefore, even if a large amount of sound source data is not collected separately, one or more classification result information for various sound sources may be collected from one or more sound source classification terminals to gradually improve the sound source classification model.

또한, 전술한 본 발명의 과제 해결 수단에 의하면, 음원 분류 모델에 의한 분류 결과에 대해 사용자로부터 피드백(feedback)을 받고, 이러한 피드백에 따른 분류 결과를 기존의 음원 분류 모델에 적용하므로, 다수의 사용자에 의한 피드백을 이용하여 음원 분류 모델을 훈련시킬 수 있어, 전문가에 의한 훈련 없이도 객관적인 음원 분류 모델을 구축할 수 있다.
In addition, according to the above-described problem solving means of the present invention, a user receives feedback on the classification result by the sound source classification model, and applies the classification result according to the feedback to the existing sound source classification model, thus providing a large number of users. The sound source classification model can be trained using the feedback by the user, and an objective sound source classification model can be constructed without training by an expert.

도 1은 본 발명의 일 실시예에 따른 음원 분류 모델 관리 시스템의 구성을 도시한 도면,
도 2는 본 발명의 일 실시예에 따른 음원 분류 모델 관리 방법의 흐름을 도시한 신호 흐름도,
도 3은 본 발명의 일 실시예에 따른 음원 분류 단말에서 음원을 분류하는 방법의 흐름을 도시한 순서도,
도 4는 본 발명의 일 실시예에 따른 음원 분류 모델 관리 서버의 구성을 도시한 도면,
도 5는 본 발명의 일 실시예에 따른 음원 분류 단말의 구성을 도시한 도면.
1 is a diagram showing the configuration of a sound source classification model management system according to an embodiment of the present invention;
2 is a signal flow diagram illustrating a flow of a sound source classification model management method according to an embodiment of the present invention;
3 is a flowchart illustrating a flow of a method for classifying a sound source in a sound source classification terminal according to an embodiment of the present invention;
4 is a diagram showing the configuration of a sound source classification model management server according to an embodiment of the present invention;
5 is a diagram showing the configuration of a sound source classification terminal according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is "connected" to another part, this includes not only "directly connected" but also "electrically connected" with another element in between. . In addition, when a part is said to "include" a certain component, which means that it may further include other components, except to exclude other components unless otherwise stated.

도 1은 본 발명의 일 실시예에 따른 음원 분류 모델 관리 시스템의 구성을 도시한 도면이다.1 is a diagram showing the configuration of a sound source classification model management system according to an embodiment of the present invention.

음원 분류 모델 관리 서버(100)는 최초 분류 모델을 생성하고, 생성한 분류 모델을 인터넷(10) 등의 네트워크를 통해 음원 분류 단말(200)로 전송된다.The sound source classification model management server 100 generates an initial classification model, and transmits the generated classification model to the sound source classification terminal 200 through a network such as the Internet 10.

음원 분류 모델 관리 서버(100)는 음원 분류 단말(200)에 의해 수행된 하나이상의 음원 분류 결과를 수신하고, 수신한 하나 이상의 음원 분류 결과를 음원 분류 모델에 반영하여 기존의 음원 분류 모델을 갱신시킨다. 음원 분류 모델 관리 서버(100)는 이러한 과정을 통해 음원 분류 모델을 점진적으로 업그레이드(upgrade)시킬 수 있다.The sound source classification model management server 100 receives one or more sound source classification results performed by the sound source classification terminal 200 and updates the existing sound source classification model by reflecting the received one or more sound source classification results in the sound source classification model. . The sound source classification model management server 100 may gradually upgrade the sound source classification model through this process.

음원 분류 단말(200)은 음원 분류 모델 관리 서버(100)로부터 수신한 음원 분류 모델을 저장하고, 사용자로부터 수신한 하나 이상의 음원에 대한 분류 요청에 응답하여 분류 모델을 이용한 음원 분류를 수행한다.The sound source classification terminal 200 stores the sound source classification model received from the sound source classification model management server 100 and performs sound source classification using the classification model in response to a classification request for one or more sound sources received from the user.

음원 분류 단말(200)은 음원 분류 모델 관리 서버(100)에서 기존의 음원 분류 모델에 음원 분류 결과가 반영되도록 음원 분류 결과를 음원 분류 모델 관리 서버(100)로 전송한다. The sound source classification terminal 200 transmits the sound source classification result to the sound source classification model management server 100 so that the sound source classification result is reflected in the existing sound source classification model in the sound source classification model management server 100.

음원 분류 단말(200)은 사용자로부터 분류 결과에 대한 수정 요청을 수신하고, 수신한 수정 요청이 적용되도록 음원 분류 결과를 수정하며, 수정된 음원 분류 결과를 음원 분류 모델 관리 서버로 전송하여 기존의 음원 분류 모델에 음원 분류 결과를 반영시킨다.The sound source classification terminal 200 receives a modification request for the classification result from the user, modifies the sound classification result so that the received correction request is applied, and transmits the modified sound classification result to the sound classification classification model management server. Reflect sound source classification results in the classification model.

음원 분류 단말(200)은 음원을 수신, 저장 및 재생할 수 있는 단말이며, 데스크탑(desktop), 노트북(notebook) 등의 컴퓨터 단말뿐만 아니라 인터넷 망에 연결되어 다양한 컨텐츠를 수신하여 사용자에게 제공하는 IPTV 단말 등을 포함할 수 있다.The sound classification terminal 200 is a terminal capable of receiving, storing and playing sound sources, and an IPTV terminal connected to an internet network as well as a computer terminal such as a desktop or a notebook to receive various contents and provide them to a user. And the like.

도 2는 본 발명의 일 실시예에 따른 음원 분류 모델 관리 방법의 흐름을 도시한 신호 흐름도이다.2 is a signal flow diagram illustrating a flow of a sound source classification model management method according to an embodiment of the present invention.

단계(S105)에서, 음원 분류 모델 관리 서버(100)는 미리 수집한 음원 정보 및 음원 분류 정보를 이용하여 음원 분류 모델을 생성한다. 음원 분류 모델은 음원의 특징 정보를 이용하여 음원의 장르, 종류 등의 특정 범주로 분류하는 기준이 되는 것으로, 음원 분류 모델 관리 서버(100)는 음원의 특징 정보, 예를 들어 Spectral Centroid, Spectral Rolloff Point, Spectral Flux, Compactness, Spectral Variability, Root Mean Square, Fraction Of Low Energy Windows, Zero Crossings, Strongest Beat, Beat Sum, Strength Of Strongest Beat, MFCC, LPC, Method of Moments 등 음원의 음색, 리듬 및 파형의 특징을 나타낼 수 있는 하나 이상의 정보를 기초로 하여 음원을 장르 등의 특정한 범주로 분류할 수 있는 음원 분류 모델을 생성할 수 있다.In step S105, the sound source classification model management server 100 generates a sound source classification model by using previously collected sound source information and sound source classification information. The sound source classification model is a standard for classifying a specific category such as genre and type of sound source by using the characteristic information of the sound source, and the sound source classification model management server 100 determines the characteristic information of the sound source, for example, Spectral Centroid, Spectral Rolloff. Point, Spectral Flux, Compactness, Spectral Variability, Root Mean Square, Fraction Of Low Energy Windows, Zero Crossings, Strongest Beat, Beat Sum, Strength Of Strongest Beat, MFCC, LPC, Method of Moments, etc. Based on one or more pieces of information capable of representing a feature, a sound source classification model may be generated to classify a sound source into a specific category such as a genre.

음원 분류 모델은 음원을 분류하기 위한 데이터뿐만 아니라 각각의 음원의 특징 정보를 포함할 수 있다. The sound source classification model may include characteristic information of each sound source as well as data for classifying sound sources.

단계(S110)에서, 음원 분류 단말(200)은 사용자로부터 음원 분류 요청 및 분류 대상이 되는 음원의 전자 파일 또는 음원의 정보를 수신한다.In step S110, the sound source classification terminal 200 receives a sound source classification request from the user and information on an electronic file or sound source of a sound source to be classified.

단계(S115)에서, 음원 분류 단말(200)은 음원 분류 모델이 저장되어 있는지 여부를 판단한다. 이전에 음원 분류가 수행되었던 경우, 음원 분류 단말(200)은 음원 분류 모델 관리 서버(100)로부터 음원 분류 모델을 수신하여 저장한 상태일 수 있다. 반면에, 이전에 음원 분류가 수행된 적이 없는 경우, 음원 분류 단말(200)은 음원 분류에 사용할 수 있는 음원 분류 모델을 음원 분류 모델 관리 서버(100)에 요청하여야 한다.In step S115, the sound source classification terminal 200 determines whether the sound source classification model is stored. When the sound source classification has been previously performed, the sound source classification terminal 200 may be in a state of receiving and storing the sound source classification model from the sound source classification model management server 100. On the other hand, when the sound source classification has not been performed before, the sound source classification terminal 200 should request the sound source classification model management server 100 for a sound source classification model that can be used for sound source classification.

단계(S120)에서, 음원 분류에 사용할 수 있는 음원 분류 모델이 없는 경우, 음원 분류 단말(200)은 음원 분류 모델 관리 서버(100)에 음원 분류 모델을 요청한다.In step S120, when there is no sound source classification model that can be used for sound source classification, the sound source classification terminal 200 requests the sound source classification model from the sound source classification model management server 100.

단계(S125)에서, 음원 분류 모델 관리 서버(100)는 단계(S120)에서 수신한 요청에 응답하여 단계(S105)에서 생성한 음원 분류 모델을 음원 분류 단말(200)에 제공한다.In step S125, the sound source classification model management server 100 provides the sound source classification model generated in step S105 to the sound source classification terminal 200 in response to the request received in step S120.

단계(S130)에서, 음원 분류 단말(200)은 단계(S125)에서 음원 분류 모델 관리 서버(100)로부터 수신한 음원 분류 모델을 이용하여 단계(S110)에서 요청된 음원에 대한 분류를 수행한다.In step S130, the sound source classification terminal 200 performs the classification for the sound source requested in step S110 using the sound source classification model received from the sound source classification model management server 100 in step S125.

즉, 음원 분류 단말(200)은 단계(S110)에서 요청된 음원의 특정 정보를 획득하고, 획득한 특징 정보를 음원 분류 모델에 적용하여 음원의 특징 정보에 매칭되는 범주를 획득하며, 획득된 범주, 예를 들어 장르에 대해 음원을 분류시킬 수 있다.That is, the sound source classification terminal 200 obtains the specific information of the sound source requested in step S110, obtains a category matching the feature information of the sound source by applying the acquired feature information to the sound source classification model, and obtains the category. For example, sound sources can be classified for genres.

음원 분류 단말(200)은 분류 결과를 분류 대상 음원 정보에 반영하거나, 분류 결과를 포함하는 음원 정보를 생성할 수 있다.The sound source classification terminal 200 may reflect the classification result in the classification target sound source information or may generate sound source information including the classification result.

단계(S135)에서, 음원 분류 단말(200)은 단계(S130)에서 분류된 결과에 대해 사용자에 의해 입력된 수정 정보를 수신한다.In step S135, the sound source classification terminal 200 receives the correction information input by the user with respect to the result classified in step S130.

단계(S130)에서 수행된 음원의 분류는 단계(S125)에서 음원 분류 모델 관리 서버(100)로부터 수신한 음원 분류 모델을 기초하여 수행되는 것이나, 음원 분류 모델에 의한 일괄적인 음원 분류의 결과가 사용자의 판단과 상이할 수 있다.The classification of the sound source performed in step S130 is performed based on the sound source classification model received from the sound source classification model management server 100 in step S125, but the result of the collective sound source classification by the sound source classification model is determined by the user. It may be different from the judgment of.

따라서, 사용자가 음원 분류 결과에 수정이 필요하다고 판단하는 경우, 사용자는 미리 구비된 수정 요청용 인터페이스 등을 통해 수정 요청을 음원 분류 단말(200)에 입력할 수 있다.Accordingly, when the user determines that the sound source classification result needs to be corrected, the user may input a correction request to the sound source classification terminal 200 through a correction request interface provided in advance.

단계(S140)에서, 음원 분류 단말(200)은 단계(S130)에서 수행된 음원 분류 결과가 반영된 음원 정보에 단계(S135)에서 수신된 수정 정보가 반영되도록 분류 대상 음원의 정보를 수정한다.In step S140, the sound source classification terminal 200 modifies the information of the sound source to be classified so that the correction information received in step S135 is reflected in the sound source information reflecting the sound source classification result performed in step S130.

단계(S145)에서, 음원 분류 단말(200)은 단계(S140)에서 최종적으로 분류가 수행된 음원의 정보를 음원 분류 모델 관리 서버(100)로 전송한다. 음원 분류 모델 관리 서버(100)로 전송되는 음원 정보는 음원의 식별 정보, 특징 정보 및 분류 결과 정보를 포함할 수 있다.In step S145, the sound source classification terminal 200 transmits the information of the sound source that was finally classified in step S140 to the sound source classification model management server 100. The sound source information transmitted to the sound source classification model management server 100 may include identification information, characteristic information, and classification result information of the sound source.

단계(S150)에서, 음원 분류 모델 관리 서버(100)는 단계(S145)에서 수신한 음원 정보를 기존의 음원 분류 모델에 반영하여, 음원의 특징 정보에 따른 음원 분류 방법이 갱신된 음원 분류 모델을 생성한다.In step S150, the sound source classification model management server 100 reflects the sound source information received in step S145 to the existing sound source classification model, and updates the sound source classification model according to the sound source classification method according to the feature information of the sound source. Create

도 2에서는 음원 분류 모델 관리 서버(100)가 하나의 음원 분류 단말(200)로 음원 분류 모델을 전송하고 수정된 음원 분류 모델을 수신하는 것으로 표현되었으나, 본 발명의 일 실시예에서 음원 분류 모델 관리 서버(100)는 도 1에 도시된 바와 같이 하나 이상의 음원 분류 단말(200)로 음원 분류 모델을 전송하고 수정된 음원 분류 모델을 수신한다.In FIG. 2, although the sound source classification model management server 100 transmits the sound source classification model to one sound source classification terminal 200 and receives the modified sound source classification model, the sound source classification model management in one embodiment of the present invention. As illustrated in FIG. 1, the server 100 transmits a sound source classification model to one or more sound source classification terminals 200 and receives a modified sound source classification model.

따라서, 음원 분류 모델 관리 서버(100)는 하나 이상의 음원 분류 단말로부터 음원 분류 결과를 수신하고, 수신한 하나 이상의 수정 음원 분류 모델을 기존의 음원 분류 모델에 반영할 수 있다. 이처럼 다양한 음원에 대한 음원 분류 결과를 하나 이상의 음원 분류 단말로부터 수신하고 기존의 음원 분류 모델에 반영하는 과정을 통해 음원 분류 모델 관리 서버는 음원 분류 모델을 점차 개선시켜 객관성을 향상시킬 수 있다.Therefore, the sound source classification model management server 100 may receive sound source classification results from one or more sound source classification terminals, and reflect the received one or more modified sound source classification models in the existing sound source classification model. Thus, through the process of receiving sound source classification results for various sound sources from one or more sound source classification terminals and reflecting them in the existing sound source classification model, the sound source classification model management server may gradually improve the sound source classification model to improve objectivity.

또한, 음원 분류 모델 관리 서버(100)는 음원 분류 결과뿐만 아니라 분류 대상인 음원의 정보를 함께 수신하므로, 음원에 대한 데이터를 수집하여 별도의 데이터베이스, 특히 음원의 특징 정보에 대한 데이터베이스를 구축할 수 있다.In addition, since the sound source classification model management server 100 receives not only the sound source classification result but also information on the sound source to be classified, it is possible to collect data on the sound source and build a separate database, particularly a database on the characteristic information of the sound source. .

도 3은 본 발명의 일 실시예에 따른 음원 분류 단말에서 음원을 분류하는 방법의 흐름을 도시한 순서도이다.3 is a flowchart illustrating a method of classifying a sound source in a sound source classification terminal according to an embodiment of the present invention.

단계(S205)에서, 음원 분류 단말은 사용자로부터 음원 분류에 대한 요청을 수신한다. 음원 분류 단말은 음원 분류 요청과 함께 분류 대상인 음원의 전자 파일을 수신할 수 있다.In step S205, the sound source classification terminal receives a request for sound source classification from the user. The sound source classification terminal may receive an electronic file of a sound source to be classified together with the sound source classification request.

단계(S210)에서, 음원 분류 단말은 음원 분류의 기준이 되는 음원 분류 모델이 음원 분류 단말의 데이터베이스에 존재하는지 여부를 판단한다. 단계(S205)에서 음원 분류 요청을 수신하기 이전에 음원 분류 단말이 음원을 분류했던 경우, 음원 분류 단말의 데이터베이스에 음원 분류 모델이 저장되어있을 수 있으나, 이전에 음원 분류를 수행하지 않았던 경우, 음원 분류 단말의 데이터베이스에 음원 분류 모델이 저장되어 있지 않을 수 있다.In step S210, the sound source classification terminal determines whether a sound source classification model, which is a reference for sound source classification, exists in the database of the sound source classification terminal. If the sound source classification terminal classifies the sound source before receiving the sound source classification request in step S205, the sound source classification model may be stored in the database of the sound source classification terminal, but if the sound source classification has not been previously performed, the sound source The sound source classification model may not be stored in the database of the classification terminal.

단계(S215)에서는, 단계(S210)에서 음원 분류 모델이 음원 분류 단말의 데이터베이스에 존재하지 않는 것으로 판단되는 경우, 음원 분류 단말은 음원 분류 모델을 음원 분류 모델 관리 서버에 요청하고, 음원 분류 모델 관리 서버로부터 음원 분류 모델을 수신한다.In step S215, when it is determined in step S210 that the sound source classification model does not exist in the database of the sound source classification terminal, the sound source classification terminal requests the sound source classification model from the sound source classification model management server, and manages the sound source classification model. Receive sound source classification model from server.

단계(S220)에서, 음원 분류 단말은 분류 대상인 음원의 특징 정보를 획득하기 위하여 음원 분류 모델과 함께 데이터베이스에 저장된 음원 정보 중에서 분류 대상인 음원에 매칭되는 정보를 검색한다.In step S220, the sound source classification terminal searches for information matching the sound source to be classified from the sound source information stored in the database together with the sound source classification model to obtain feature information of the sound source to be classified.

음원 분류 단말의 데이터베이스에 저장된 음원 정보는 표 1에서와 같이 '음원 ID' 필드, '특징 정보' 필드 및 '분류 범주' 필드를 포함할 수 있다.
The sound source information stored in the database of the sound source classification terminal may include a 'sound source ID' field, a 'feature information' field, and a 'classification category' field as shown in Table 1.

음원 IDSound source ID 특징 정보Feature Information 분류 범주Classification category D47AF57D47AF57 0.023∥0.941∥0.142∥0.775∥…0.023∥0.941∥0.142∥0.775∥… 2A0165B2A0165B 0.417∥0.633∥0.701∥0.053∥…0.417∥0.633∥0.701∥0.053∥… 1B78FFF1B78FFF 0.612∥0.619∥0.882∥0.154∥…0.612 ∥ 0.619 ∥ 0.882 ∥ 0.154 ∥… 44EAC5544EAC55 0.241∥0.323∥0.531∥0.992∥…0.241 ∥ 0.323 ∥ 0.531 ∥ 0.992 ∥…

'음원 ID' 필드는 다른 음원과 구분할 수 있는 식별자 정보를 포함하고, '특징 정보' 필드는 음원의 음색, 리듬, 파형 등의 특징에 대한 정보를 포함하며, '분류 범주' 필드는 음원이 분류된 결과 정보를 포함할 수 있다.The 'sound source ID' field includes identifier information that can be distinguished from other sound sources, and the 'feature information' field includes information on characteristics of the sound source, rhythm, waveform, etc., and the 'categorization category' field is classified by the sound source. Can include the result information.

음원 분류 단말은 음원 분류 요청과 함께 수신한 음원의 전자 파일로부터 음원 ID(identification) 정보를 획득하고, 획득한 음원 ID를 이용하여 데이터베이스에 저장된 음원 정보 중에서 분류 대상인 음원의 특징 정보를 검색할 수 있다.The sound source classification terminal may obtain sound source identification information from the electronic file of the sound source received together with the sound source classification request, and search for the characteristic information of the sound source, which is the classification target, from the sound source information stored in the database using the obtained sound source ID. .

단계(S225)에서, 단계(S220)에서 검색한 결과, 분류 대상인 음원에 매칭되는 특징 정보가 존재하는지 여부를 판단한다. 분류 대상인 음원의 정보가 기존에 데이터베이스에 저장될 수도 있으나, 분류 대상인 음원이 새로운 음원이거나 또는 기타 다양한 이유로 인하여 데이터베이스에 저장되지 않을 수 있으므로, 분류 대상인 음원에 매칭되는 특징 정보가 존재 여부를 판단한다.In step S225, as a result of the search in step S220, it is determined whether there is characteristic information matching the sound source to be classified. Although the information of the sound source to be classified may be previously stored in the database, since the sound source to be classified may not be stored in the database for a new sound source or various other reasons, it is determined whether there is feature information matching the sound source to be classified.

단계(S230)에서는, 단계(S225)에서 분류 대상 음원에 매칭되는 특징 정보가 존재하지 않는 것으로 판단되는 경우, 음원 분류 단말은 분류 대상 음원에 매칭되는 특징 정보를 음원 분류 모델 관리 서버에 요청한다.In step S230, when it is determined in step S225 that there is no feature information matching the sound source to be classified, the sound source classification terminal requests the sound source classification model management server for feature information matching the sound source to be classified.

음원 분류 단말은 분류 대상 음원에 매칭되는 특징 정보 요청과 함께 분류 대상 음원의 식별 정보, 예를 들어 음원 ID의 정보를 함께 음원 분류 모델 관리 서버로 전송할 수 있다.The sound source classification terminal may transmit identification information of the sound source to be classified, for example, information of the sound source ID, together with the feature information request matching the sound source to be classified to the sound source classification model management server.

단계(S235)에서, 단계(S230)에서 특징 정보를 요청한 후, 음원 분류 모델 관리 서버로부터 해당 특징 정보를 수신하였는지 또는 해당 특징 정보가 존재하지 않는다는 응답을 수신하였는지 여부를 판단한다.In step S235, after requesting the feature information in step S230, it is determined whether the corresponding feature information is received from the sound source classification model management server or a response indicating that the feature information does not exist.

단계(S240)에서는, 단계(S235)에서 음원 분류 모델 관리 서버로부터 분류 대상 음원에 대한 특징 정보가 존재하지 않는다는 응답을 수신한 경우, 음원 분류 단말을 분류 대상 음원을 분석하여 분류 대상 음원의 특징 정보를 획득한다.In step S240, when receiving a response from the sound source classification model management server that the feature information for the sound source to be classified does not exist in step S235, the sound source classification terminal analyzes the sound source to be classified and the feature information of the sound source to be classified. Acquire it.

단계(S245)에서, 음원 분류 단말은 단계(S230)에서의 요청에 따라 음원 분류 모델 관리 서버로부터 획득한 분류 대상 음원의 특징 정보 또는 단계(S240)에서 음원 분류 단말이 획득한 특징 정보를 이용하여 분류 대상 음원을 미리 설정된 범주, 예를 들어 장르 등에 대한 분류를 수행한다.In step S245, the sound source classification terminal uses the characteristic information of the sound source classification terminal obtained from the sound source classification model management server according to the request in step S230 or the feature information obtained by the sound source classification terminal in step S240. The classification target sound source is classified into a preset category, for example, a genre.

즉, 음원 분류 단말은 획득한 특징 정보를 음원 분류 모델에 적용하여 분류 대상 음원에 대한 장르 등의 분류를 수행할 수 있다.That is, the sound source classification terminal may apply the acquired feature information to the sound source classification model to perform classification such as genre of the sound source to be classified.

음원 분류 단말은 분류 결과를 디스플레이 장치 등을 통해 사용자에게 제공할 수 있다.The sound source classification terminal may provide the classification result to a user through a display device or the like.

단계(S250)에서, 음원 분류 단말은 단계(S245)에서 수행된 분류의 결과를 음원 정보에 반영한다. 예를 들어 표 1에서 음원 ID가 '1B78FFF'인 음원이 '발라드'로 분류된 경우, 음원 분류 단말은 음원 ID가 '1B78FFF'인 음원의 정보에 포함된 '분류 범주' 필드에 '발라드'가 포함되도록 음원 정보를 수정할 수 있다.In step S250, the sound source classification terminal reflects the result of the classification performed in step S245 in the sound source information. For example, in Table 1, when a sound source having a sound source ID of '1B78FFF' is classified as 'ballad', the sound source classification terminal has a 'ballard' in the 'classification category' field included in the information of the sound source having a sound source ID of '1B78FFF'. The sound source information can be modified to be included.

단계(S255)에서, 음원 분류 단말은 단계(S245)에서 수행된 음원의 분류 결과에 대한 수정 요청 입력을 사용자로부터 수신하였는지 여부를 판단한다. 전술한 바와 같이, 음원 분류 모델에 의한 음원의 분류는 통계적 방법을 통해 훈련된 기준에 의하여 일률적으로 수행되므로, 음원의 분류 결과가 사용자의 판단과 상이할 수 있다.In step S255, the sound source classification terminal determines whether a user has received a modification request input for the classification result of the sound source performed in step S245. As described above, the classification of the sound source by the sound source classification model is uniformly performed based on a trained standard through a statistical method, so that the classification result of the sound source may be different from the judgment of the user.

이처럼 음원 분류 모델에 의한 음원 분류 결과와 사용자의 판단이 상이한 경우, 사용자는 음원 분류 단말에 의해 제공된 수단을 이용하여 음원의 분류 결과에 대한 수정을 요청할 수 있다.As such, when the sound source classification result by the sound source classification model and the user's judgment are different, the user may request correction of the sound classification result by means provided by the sound source classification terminal.

단계(S260)에서는, 단계(S255)에서 음원의 분류 결과에 대한 수정 요청 입력이 사용자로부터 수신된 것으로 판단된 경우, 사용자의 수정 요청을 단계(S250)에서 분류 결과가 반영된 음원 정보에 적용하여 분류 대상 음원의 정보를 갱신한다.In step S260, when it is determined in step S255 that a correction request input for the classification result of the sound source is received from the user, the user's correction request is applied to the sound source information reflecting the classification result in step S250 for classification. Update the information of the target sound source.

단계(S265)에서, 음원 분류 단말은 단계(S250) 또는 단계(S260)에서 분류 결과가 반영된 분류 대상 음원의 정보를 음원 분류 모델 관리 서버로 전송한다.In step S265, the sound source classification terminal transmits information of the classification target sound source reflecting the classification result in step S250 or step S260 to the sound source classification model management server.

서버로 전송된 분류 결과를 포함하는 음원 정보가 음원 분류 모델 관리 서버에 의해 기존의 음원 분류 모델에 반영되어 음원 분류 모델이 갱신될 수 있다. 즉, 음원 분류 모델은 통계적 방법을 이용하여 훈련된 분류 기준에 음원의 특징 정보를 적용하여 음원을 분류한다. 따라서, 하나 이상의 음원 분류 단말에 의해 수행된 하나 이상의 분류의 결과가 음원 분류 모델에 반영되어 음원 분류 모델이 점진적으로 업그레이드(upgrade)될 수 있으며, 음원 분류 모델의 분류 기준의 정확성이 향상될 수 있다.The sound source information including the classification result transmitted to the server may be reflected in the existing sound source classification model by the sound source classification model management server to update the sound source classification model. That is, the sound source classification model classifies sound sources by applying the characteristic information of the sound sources to the classification criteria trained using the statistical method. Therefore, the result of one or more classifications performed by the one or more sound source classification terminals may be reflected in the sound source classification model so that the sound source classification model may be gradually upgraded, and the accuracy of the classification criteria of the sound source classification model may be improved. .

도 4는 본 발명의 일 실시예에 따른 음원 분류 모델 관리 서버의 구성을 도시한 도면이다.4 is a diagram illustrating a configuration of a sound source classification model management server according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 음원 분류 모델 관리 서버(100)는 데이터 송수신부(110), 분류 모델 제공부(120), 분류 모델 관리부(130), 분류 모델 데이터베이스(140) 및 음원 정보 데이터베이스(150)를 포함한다.Sound source classification model management server 100 according to an embodiment of the present invention is a data transmission and reception unit 110, classification model providing unit 120, classification model management unit 130, classification model database 140 and sound source information database ( 150).

데이터 송수신부(110)는 음원 분류 단말(도시 생략)로부터 음원 분류 모델의 요청 또는 특정 음원에 대한 특징 정보의 요청을 수신하고, 수신한 요청을 분류 모델 제공부(120)에 전달한다. 또한, 데이터 송수신부(110)는 음원 분류 단말로 음원 분류 모델 또는 음원의 특징 정보를 전송한다.The data transceiver 110 receives a request for a sound source classification model or a request for feature information about a specific sound source from a sound source classification terminal (not shown), and transmits the received request to the classification model provider 120. In addition, the data transmitting and receiving unit 110 transmits the sound source classification model or the characteristic information of the sound source to the sound source classification terminal.

데이터 송수신부(110)는 음원 분류 단말로부터 음원 분류 단말에서의 음원 분류 결과가 반영되어 수정된 음원 분류 모델을 수신하여 분류 모델 데이터베이스(140)에 저장한다. 또한, 데이터 송수신부(110)는 수정된 음원 분류 모델과 함께 음원의 식별 정보 및 특징 정보를 수신할 수 있으며, 수신한 음원의 특징 정보를 식별 정보와 매칭하여 음원 정보 데이터베이스(150)에 저장한다.The data transmitter / receiver 110 receives the modified sound source classification model by reflecting the sound source classification result from the sound source classification terminal from the sound source classification terminal and stores it in the classification model database 140. In addition, the data transmission / reception unit 110 may receive the identification information and the characteristic information of the sound source together with the modified sound source classification model, and match the characteristic information of the received sound source with the identification information and store it in the sound source information database 150. .

분류 모델 제공부(120)는 음원 분류 단말로부터 수신한 음원 분류 모델의 요청에 응답하여 분류 모델 데이터베이스(140)에 저장된 음원 분류 모델을 데이터 송수신부(110)를 통해 음원 분류 단말로 전송한다.The classification model providing unit 120 transmits the sound source classification model stored in the classification model database 140 to the sound source classification terminal in response to the request of the sound source classification model received from the sound source classification terminal.

분류 모델 제공부(120)는 음원 분류 단말로부터 수신한 특정 음원에 대한 특징 정보의 요청에 응답하여 요청과 함께 수신한 음원의 식별 정보를 이용하여 음원 정보 데이터베이스(150)에서 요청된 음원의 특징 정보를 검색한다.The classification model providing unit 120 uses the identification information of the sound source received with the request in response to the request for the characteristic information on the specific sound source received from the sound source classification terminal, and the feature information of the sound source requested from the sound source information database 150. Search for.

요청된 음원의 특징 정보가 음원 정보 데이터베이스(150)에 존재하는 경우, 분류 모델 제공부(120)는 검색한 특징 정보를 데이터 송수신부(110)를 통해 음원 분류 단말로 전송한다. 요청된 음원의 특징 정보가 음원 정보 데이터베이스(150)에 존재하지 않는 경우, 분류 모델 제공부(120)는 음원의 특징 정보가 존재하지 않음을 알리는 응답을 음원 분류 단말로 전송한다.When the requested feature information of the sound source exists in the sound source information database 150, the classification model provider 120 transmits the retrieved feature information to the sound source classification terminal through the data transceiver 110. If the feature information of the requested sound source does not exist in the sound source information database 150, the classification model providing unit 120 transmits a response indicating that the feature information of the sound source does not exist to the sound source classification terminal.

분류 모델 관리부(130)는 데이터 송수신부(110)가 수신한, 음원 분류 단말에 의해 수정된 음원 분류 모델을 기존의 음원 분류 모델에 반영하여 음원 분류 모델을 갱신한다. 전술한 바와 같이, 음원 분류 모델은 통계적 방법을 통해 생성된 음원을 분류하는 기준을 제공하는 것이므로 하나 이상의 음원 분류 단말에 의해 수정된 하나 이상의 음원 분류 모델을 기존의 음원 분류 모델에 반영하여 점진적으로 음원 분류 모델을 개선시킬 수 있다.The classification model manager 130 updates the sound source classification model by reflecting the sound source classification model corrected by the sound source classification terminal received by the data transceiver 110 in the existing sound source classification model. As described above, since the sound source classification model provides a criterion for classifying sound sources generated through a statistical method, the sound source is gradually reflected by applying one or more sound source classification models modified by one or more sound source classification terminals to the existing sound source classification model. Improve your classification model.

도 5는 본 발명의 일 실시예에 따른 음원 분류 단말의 구성을 도시한 도면이다.5 is a diagram illustrating a configuration of a sound source classification terminal according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 음원 분류 단말(200)은 데이터 송수신부(210), 음원 장르 분류부(220), 특징 정보 추출부(230), 음원 정보 갱신부(240), 사용자 수정 적용부(250) 및 분류 모델 데이터베이스(260)를 포함한다.Sound source classification terminal 200 according to an embodiment of the present invention is a data transmission and reception unit 210, sound source genre classification unit 220, feature information extraction unit 230, sound source information update unit 240, user modification application unit 250 and classification model database 260.

데이터 송수신부(210)는 사용자에 의해 입력된 음원 분류 요청 및 음원의 분류 결과에 대한 수정 요청을 수신한다. 데이터 송수신부(210)는 음원 분류 요청과 함께 분류 대상인 음원을 수신할 수 있다.The data transmission / reception unit 210 receives a sound source classification request input by a user and a modification request for the classification result of the sound source. The data transceiver 210 may receive a sound source to be classified together with the sound source classification request.

데이터 송수신부(210)는 음원 분류 모델 관리 서버(도시 생략)로 음원 분류 모델 또는 음원의 특징 정보를 요청하고, 음원 분류 모델 관리 서버로부터 음원 분류 모델 및 음원의 특징 정보를 수신한다. 데이터 송수신부(210)에 의해 수신된 음원 분류 모델 및 음원의 특징 정보는 각각 분류 모델 데이터베이스(260) 및 음원 정보 데이터베이스(270)에 저장된다.The data transmission / reception unit 210 requests a sound classification classification model or feature information of a sound source from a sound classification classification model management server (not shown), and receives a sound classification classification model and feature information of a sound source from the sound classification classification model management server. The sound source classification model and the feature information of the sound source received by the data transceiver 210 are stored in the classification model database 260 and the sound source information database 270, respectively.

또한, 데이터 송수신부(210)는 음원 분류 단말(200)에 의해 수정된 음원 분류 모델을 음원 분류 모델 관리 서버로 전송한다.In addition, the data transmission and reception unit 210 transmits the sound source classification model modified by the sound source classification terminal 200 to the sound source classification model management server.

음원 분류부(220)는 사용자에 의해 분류 요청된 음원에 대해 음원 분류를 수행한다. 음원 분류부(220)는 분류 모델 데이터베이스(260)에 저장된 음원 분류 모델을 이용하여 음원 분류를 수행할 수 있다.The sound source classification unit 220 performs sound source classification on the sound source requested to be classified by the user. The sound source classification unit 220 may perform sound source classification using the sound source classification model stored in the classification model database 260.

즉, 음원 분류부(220)는 데이터 송수신부(210)를 통해 수신한 분류 대상인 음원을 분석하여 음원의 식별 정보, 예를 들어 음원 ID(identification)을 획득하고, 음원 ID에 매칭되는 특징 정보를 음원 정보 데이터베이스(270)에서 검색한다.That is, the sound source classifying unit 220 analyzes the sound source, which is a classification target received through the data transmitting and receiving unit 210, obtains identification information of the sound source, for example, sound source ID, and obtains feature information matching the sound source ID. The sound source information database 270 is searched.

음원 ID에 매칭되는 특징 정보가 음원 정보 데이터베이스(270)에 존재하지 않는 경우, 음원 분류부(220)는 데이터 송수신부(210)를 통해 분류 대상 음원의 특징 정보를 음원 분류 모델 관리 서버에 요청한다.When the feature information matching the sound source ID does not exist in the sound source information database 270, the sound source classification unit 220 requests the sound source classification model management server for the feature information of the sound source to be classified through the data transceiver 210. .

음원 분류 모델 관리 서버로부터 음원의 특징 정보가 존재하지 않는다는 응답을 수신한 경우, 음원 분류부(220)는 분류 대상 음원의 특징 정보를 특징 정보 추출부(230)에 요청한다.When a response from the sound source classification model management server is received that the feature information of the sound source does not exist, the sound source classification unit 220 requests the feature information extraction unit 230 for feature information of the sound source to be classified.

음원 분류부(220)는 음원 정보 데이터베이스(270), 음원 분류 모델 관리 서버(도시 생략) 또는 특징 추출부(230)로부터 분류 대상 음원의 특징 정보를 수신하고, 수신한 특징 정보를 음원 분류 모델에 적용하여 미리 설정된 범주, 예를 들어 장르에 대해 음원을 분류한다. 음원 분류부(220)는 하나 이상의 음원에 대한 분류를 수행할 수 있다.The sound source classification unit 220 receives the feature information of the sound source to be classified from the sound source information database 270, the sound source classification model management server (not shown), or the feature extraction unit 230, and transmits the received feature information to the sound source classification model. Apply to classify sound sources for preset categories, eg genres. The sound source classification unit 220 may classify one or more sound sources.

특징 정보 추출부(230)는 음원 분류부(220)의 요청에 응답하여 분류 대상 음원을 분석하여 음원의 스펙트럴 센트로이드(Spectral Centroid), 스펙트럴 롤오프 포인트(Spectral Rolloff Point), 스펙트럴 플럭스(Spectral Flux) 등의 특징 정보를 추출한다. 특징 정보 추출부(230)는 추출한 특징 정보를 음원 분류부(220)에 제공한다. The feature information extractor 230 analyzes the sound source to be classified in response to a request of the sound source classifier 220 to detect the spectral centroid, the spectral rolloff point, and the spectral flux of the sound source. Feature information such as Spectral Flux) is extracted. The feature information extractor 230 provides the extracted feature information to the sound source classifier 220.

음원 정보 갱신부(240)는 음원 분류부(220)에 의한 분류 결과를 분류 대상 음원의 정보에 반영하여 분류 요청된 음원의 정보를 갱신한다. 예를 들어, 음원 정보는 상술한 표 1에서와 같이 '음원 ID' 필드, '특징 정보' 필드 및 '분류 범주' 필드를 포함할 수 있다. 음원 정보 갱신부(240)는 음원 분류부(220)에 의해 수행된 분류 결과가 '분류 범주' 필드에 포함되도록 음원 정보를 갱신하고, 갱신된 음원 정보를 음원 정보 데이터베이스(270)에 저장시킬 수 있다.The sound source information updating unit 240 updates the information of the sound source requested for classification by reflecting the result of the classification by the sound source classifying unit 220 in the information of the sound source to be classified. For example, the sound source information may include a 'sound source ID' field, a 'feature information' field, and a 'classification category' field as shown in Table 1 above. The sound source information updater 240 may update the sound source information so that the classification result performed by the sound source classifier 220 is included in the 'classification category' field, and store the updated sound source information in the sound source information database 270. have.

따라서, 음원 정보 데이터베이스(270)는 음원 정보 갱신부(240)에 의해 표 1에서 표 2와 같이 갱신된 음원 정보를 저장할 수 있다.
Therefore, the sound source information database 270 may store the sound source information updated by the sound source information updating unit 240 as shown in Table 1 to Table 2.

음원 IDSound source ID 특징 정보Feature Information 분류 범주Classification category D47AF57D47AF57 0.023∥0.941∥0.142∥0.775∥…0.023∥0.941∥0.142∥0.775∥… 댄스dance 2A0165B2A0165B 0.417∥0.633∥0.701∥0.053∥…0.417∥0.633∥0.701∥0.053∥… 발라드Ballade 1B78FFF1B78FFF 0.612∥0.619∥0.882∥0.154∥…0.612 ∥ 0.619 ∥ 0.882 ∥ 0.154 ∥… 발라드Ballade 44EAC5544EAC55 0.241∥0.323∥0.531∥0.992∥…0.241 ∥ 0.323 ∥ 0.531 ∥ 0.992 ∥… 재즈jazz

사용자 수정 적용부(250)는 데이터 송수신부(210)를 통해 분류 결과에 대한 사용자의 수정 요청을 수신하고, 수신한 사용자 수정 요청을 음원 분류부(220)에 의해 수행된 분류 결과에 적용하여 분류 결과를 수정한다.The user correction application unit 250 receives a user's correction request for the classification result through the data transmission and reception unit 210, and applies the received user correction request to the classification result performed by the sound source classification unit 220 for classification. Correct the result.

예를 들어, 표 2에서 음원 ID가 '1B78FFF'인 음원의 분류 범주에 대해 '발라드'에서 '재즈'로의 수정이 요청된 경우, 사용자 수정 적용부(250)은 수정 요청을 기존의 분류 결과에 적용하여 아래의 표 3과 같이 음원 정보를 수정할 수 있다.
For example, in Table 2, when a modification from 'ballad' to 'jazz' is requested for a classification category of a sound source having a sound source ID of '1B78FFF', the user modification application unit 250 sends a modification request to the existing classification result. You can modify the sound source information as shown in Table 3 below.

음원 IDSound source ID 특징 정보Feature Information 분류 범주Classification category D47AF57D47AF57 0.023∥0.941∥0.142∥0.775∥…0.023∥0.941∥0.142∥0.775∥… 댄스dance 2A0165B2A0165B 0.417∥0.633∥0.701∥0.053∥…0.417∥0.633∥0.701∥0.053∥… 발라드Ballade 1B78FFF1B78FFF 0.612∥0.619∥0.882∥0.154∥…0.612 ∥ 0.619 ∥ 0.882 ∥ 0.154 ∥… 재즈jazz 44EAC5544EAC55 0.241∥0.323∥0.531∥0.992∥…0.241 ∥ 0.323 ∥ 0.531 ∥ 0.992 ∥… 재즈jazz

이처럼 음원 분류부(220)에 의한 분류 결과의 정보 또는 사용자 수정 적용부(250)에 의해 수정된 분류 결과의 정보는 데이터 송수신부(210)를 통해 음원 분류 모델 관리 서버(도시 생략)로 전송될 수 있다.As such, the information of the classification result by the sound source classification unit 220 or the information of the classification result modified by the user modification application unit 250 may be transmitted to the sound source classification model management server (not shown) through the data transmission / reception unit 210. Can be.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다. One embodiment of the present invention can also be implemented in the form of a recording medium containing instructions executable by a computer, such as a program module executed by the computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, computer readable media may include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transmission mechanism, and includes any information delivery media.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.While the methods and systems of the present invention have been described in connection with specific embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present invention is intended for illustration, and it will be understood by those skilled in the art that the present invention may be easily modified in other specific forms without changing the technical spirit or essential features of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as distributed may be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
The scope of the present invention is shown by the following claims rather than the above description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.

100 : 음원 분류 모델 관리 서버
110 : 데이터 송수신부 120 : 분류 모델 제공부
130 : 분류 모델 관리부
200 : 음원 분류 단말
210 : 데이터 송수신부 220 : 음원 분류부
230 : 특징 정보 추출부 240 : 음원 정보 갱신부
250 : 사용자 수정 적용부
100: sound source classification model management server
110: data transceiver 120: classification model provider
130: classification model management unit
200: sound classification terminal
210: data transceiver 220: sound source classification unit
230: feature information extracting unit 240: sound source information updating unit
250: user modification application

Claims (7)

음원 분류 모델 관리 서버가 음원 분류 모델을 관리하는 방법에 있어서,
(a) 음원의 음색, 리듬 및 파형에 대한 정보를 포함하는 특징 정보에 기초하여 음원을 분류하는 제 1 음원 분류 모델을 미리 수집한 음원을 이용하여 생성하는 단계,
(b) 하나 이상의 음원 분류 단말로부터 음원 분류 모델에 대한 요청을 수신하고, 상기 요청에 응답하여 상기 제 1 음원 분류 모델을 상기 음원 분류 단말로 전송하는 단계,
(c) 상기 음원 분류 단말로부터 상기 제 1 음원 분류 모델을 이용하여 분류된 음원의 정보를 수신하는 단계 및
(d) 상기 제 1 음원 분류 모델에 포함된 데이터 및 상기 분류된 음원의 정보를 모두 포함하는 제 2 음원 분류 모델을 생성하는 단계
를 포함하는 음원 분류 모델 관리 방법.
In the sound source classification model management server manages the sound source classification model,
(a) generating a first sound source classification model for classifying a sound source based on feature information including information about a tone, a rhythm, and a waveform of the sound source using a previously collected sound source;
(b) receiving a request for a sound source classification model from at least one sound source classification terminal, and transmitting the first sound source classification model to the sound source classification terminal in response to the request;
(c) receiving information of sound sources classified using the first sound source classification model from the sound source classification terminal; and
(d) generating a second sound source classification model including both data included in the first sound source classification model and information of the classified sound sources;
Sound source classification model management method comprising a.
제 1 항에 있어서,
상기 (b) 단계는,
(b1) 상기 음원 분류 단말이 상기 제 1 음원 분류 모델을 수신하는 단계,
(b2) 상기 음원 분류 단말이 분류 대상 음원의 특징 정보를 획득하는 단계,
(b3) 상기 음원 분류 단말이 상기 음원의 특징 정보를 상기 제 1 음원 분류 모델에 적용하여 상기 음원을 분류하는 단계,
(b4) 상기 음원 분류 단말이 상기 음원의 분류 결과에 대한 수정 요청을 수신하는 경우, 상기 수정 요청을 반영하여 상기 음원의 분류 결과를 수정하는 단계 및
(b5) 상기 음원 분류 단말이 상기 분류 결과를 상기 분류된 음원의 정보에 저장하는 단계
를 포함하는 것인 음원 분류 모델 관리 방법.
The method of claim 1,
In step (b),
(b1) receiving, by the sound source classification terminal, the first sound source classification model;
(b2) obtaining, by the sound source classification terminal, feature information of a sound source to be classified;
(b3) classifying the sound source by applying the characteristic information of the sound source to the first sound source classification model by the sound source classification terminal;
(b4) when the sound source classification terminal receives a modification request for the classification result of the sound source, correcting the classification result of the sound source by reflecting the modification request; and
(b5) storing, by the sound source classification terminal, the classification result in the information of the classified sound source;
Sound source classification model management method that includes.
제 2 항에 있어서,
상기 (b2) 단계는
(b21) 상기 음원 분류 단말에 구비된 데이터베이스에 상기 분류 대상 음원의 특징 정보가 존재하지 않는 경우, 상기 음원 분류 모델 관리 서버에 상기 분류 대상 음원의 특징 정보를 요청하는 단계 및
(b22) 상기 음원 분류 모델 관리 서버에 상기 분류 대상 음원의 특징 정보가 존재하지 않는 경우, 상기 분류 대상 음원을 분석하여 특징 정보를 획득하는 단계
를 포함하는 것인 음원 분류 모델 관리 방법.
The method of claim 2,
Step (b2)
(b21) requesting feature information of the classification target sound source from the sound classification classification model management server when the feature information of the classification sound source does not exist in a database provided in the sound source classification terminal;
(b22) if the feature information of the sound source to be classified does not exist in the sound source classification model management server, analyzing the sound source to be classified and obtaining feature information;
Sound source classification model management method that includes.
제 2 항에 있어서,
(b6) 상기 분류 결과가 저장된 상기 분류된 음원의 정보를 상기 음원 분류 모델 관리 서버로 전송하는 단계
를 더 포함하고,
상기 전송된 음원의 정보는 상기 분류된 음원의 식별 정보, 특징 정보 및 분류 결과 정보를 포함하는 것인 음원 분류 모델 관리 방법.
The method of claim 2,
(b6) transmitting information of the classified sound source storing the classification result to the sound source classification model management server;
Further comprising:
And the information of the transmitted sound source includes identification information, characteristic information, and classification result information of the classified sound source.
음원 분류 모델을 관리하는 음원 분류 모델 관리 시스템에 있어서,
음원 분류 단말의 요청에 응답하여 음원의 음색, 리듬 및 파형에 대한 정보를 포함하는 특징 정보에 기초하여 음원을 분류하는 제 1 음원 분류 모델을 상기 음원 분류 단말로 전송하는 분류 모델 제공부 및
미리 수집한 음원을 이용하여 상기 제 1 음원 분류 모델을 생성하고, 상기 음원 분류 단말로부터 수신한 상기 제 1 음원 분류 모델을 이용하여 분류된 음원의 정보를 기초로 제 2 음원 분류 모델을 생성하는 분류 모델 관리부
를 포함하고,
상기 제 2 음원 분류 모델은 상기 제 1 음원 분류 모델에 포함된 데이터 및 상기 분류된 음원의 정보를 모두 포함하는 것인 음원 분류 모델 관리 시스템.
In the sound source classification model management system for managing a sound source classification model,
A classification model providing unit configured to transmit a first sound source classification model for classifying a sound source to the sound source classification terminal in response to a request of the sound source classification terminal, based on feature information including information about a tone, a rhythm, and a waveform of the sound source;
The first sound source classification model is generated using the previously collected sound source, and the second sound source classification model is generated based on the information of the sound source classified using the first sound source classification model received from the sound source classification terminal. Model Management Department
Including,
And the second sound source classification model includes both data included in the first sound source classification model and information of the classified sound sources.
제 5 항에 있어서,
상기 음원 분류 단말은
상기 제 1 음원 분류 단말을 이용하여 분류 대상 음원을 분류하는 음원 분류부,
상기 음원 분류부에 의한 분류 결과를 상기 분류 대상 음원의 정보에 포함시키는 음원 정보 갱신부 및
상기 분류 결과에 대해 수신한 사용자의 수정 요청이 반영되도록 상기 분류 대상 음원의 정보를 수정하는 사용자 수정 적용부
를 포함하고,
상기 분류 대상 음원의 정보는 음원 식별 정보 필드, 특징 정보 필드 및 분류 범주 필드를 포함하는 것인 음원 분류 모델 관리 시스템.
The method of claim 5, wherein
The sound source classification terminal
A sound source classification unit for classifying the sound source to be classified using the first sound source classification terminal,
A sound source information updating unit for including the result of classification by the sound source classification unit in the information of the sound source to be classified;
User modification application unit for modifying the information of the sound source to be classified to reflect the user's request for the modification to the classification result reflected
Including,
And the information on the sound source to be classified includes a sound source identification information field, a feature information field, and a classification category field.
제 6 항에 있어서,
상기 음원 분류 단말은
상기 분류 대상 음원을 분석하여 상기 분류 대상 음원의 특징 정보를 획득하는 특징 정보 추출부
를 더 포함하는 것인 음원 분류 모델 관리 시스템.
The method according to claim 6,
The sound source classification terminal
A feature information extractor configured to analyze the sound source to be classified and obtain feature information of the sound source to be classified;
Sound source classification model management system that further comprises.
KR1020100045627A 2010-05-14 2010-05-14 Method and system for managing music data classification model KR20110125968A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100045627A KR20110125968A (en) 2010-05-14 2010-05-14 Method and system for managing music data classification model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100045627A KR20110125968A (en) 2010-05-14 2010-05-14 Method and system for managing music data classification model

Publications (1)

Publication Number Publication Date
KR20110125968A true KR20110125968A (en) 2011-11-22

Family

ID=45395263

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100045627A KR20110125968A (en) 2010-05-14 2010-05-14 Method and system for managing music data classification model

Country Status (1)

Country Link
KR (1) KR20110125968A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10121109B2 (en) 2017-04-07 2018-11-06 International Business Machines Corporation Flexible and self-adaptive classification of received audio measurements in a network environment
KR20210046416A (en) * 2019-10-18 2021-04-28 한국과학기술원 Audio classification method based on neural network for waveform input and analyzing apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10121109B2 (en) 2017-04-07 2018-11-06 International Business Machines Corporation Flexible and self-adaptive classification of received audio measurements in a network environment
KR20210046416A (en) * 2019-10-18 2021-04-28 한국과학기술원 Audio classification method based on neural network for waveform input and analyzing apparatus

Similar Documents

Publication Publication Date Title
EP3158559B1 (en) Session context modeling for conversational understanding systems
US11115724B2 (en) Visual hash tags via trending recognition activities, systems and methods
CN110705683B (en) Random forest model construction method and device, electronic equipment and storage medium
EP2438539B1 (en) Co-selected image classification
US9390378B2 (en) System and method for high accuracy product classification with limited supervision
KR101009830B1 (en) Compatibility scoring of users in a social network
US9436919B2 (en) System and method of tuning item classification
US11756059B2 (en) Discovery of new business openings using web content analysis
EP3143522A1 (en) Knowledge source personalization to improve language models
CN109597858B (en) Merchant classification method and device and merchant recommendation method and device
WO2010091320A1 (en) Determining associative intent in a database containing linked entities
KR20130062442A (en) Method and system for recommendation using style of collaborative filtering
US20100312737A1 (en) Semi-Automatic Evaluation and Prioritization of Architectural Alternatives for Data Integration
CN113742492B (en) Insurance scheme generation method and device, electronic equipment and storage medium
US20180181644A1 (en) Methods and systems for linking data records from disparate databases
CN104221017A (en) Finding data in connected corpuses using examples
CN109446374A (en) Flow retaining and real-time ranking for the result in matching system
RU2653246C1 (en) Improving request for database searching
CN108319646B (en) Vehicle source searching method and device based on user historical behaviors
CN108665148B (en) Electronic resource quality evaluation method and device and storage medium
US20200394448A1 (en) Methods for more effectively moderating one or more images and devices thereof
US20230368028A1 (en) Automated machine learning pre-trained model selector
KR20110125968A (en) Method and system for managing music data classification model
JP5000351B2 (en) Content classification system, server, terminal device, program, and recording medium
CN112836082B (en) Method and device for generating song list, electronic equipment and storage medium

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination