KR102052711B1 - 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램 - Google Patents

미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102052711B1
KR102052711B1 KR1020170161838A KR20170161838A KR102052711B1 KR 102052711 B1 KR102052711 B1 KR 102052711B1 KR 1020170161838 A KR1020170161838 A KR 1020170161838A KR 20170161838 A KR20170161838 A KR 20170161838A KR 102052711 B1 KR102052711 B1 KR 102052711B1
Authority
KR
South Korea
Prior art keywords
media
text
level
parameter
determining
Prior art date
Application number
KR1020170161838A
Other languages
English (en)
Other versions
KR20190063050A (ko
Inventor
박수영
Original Assignee
주식회사 퀄슨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 퀄슨 filed Critical 주식회사 퀄슨
Priority to KR1020170161838A priority Critical patent/KR102052711B1/ko
Publication of KR20190063050A publication Critical patent/KR20190063050A/ko
Application granted granted Critical
Publication of KR102052711B1 publication Critical patent/KR102052711B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/436Filtering based on additional data, e.g. user or group profiles using biological or physiological data of a human being, e.g. blood pressure, facial expression, gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

본 발명의 일 실시예는 텍스트 및 상기 텍스트에 대응되는 미디어의 구간 정보를 획득하고, 상기 텍스트 각각에 대하여, 상기 텍스트의 길이와 상기 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출하는 단계; 상기 제1 파라미터를 고려하여 상기 각 텍스트의 레벨을 결정하는 단계; 및 상기 각 텍스트의 레벨에 기초하여 상기 미디어의 레벨을 결정하는 단계;를 포함하는, 미디어 관리 방법을 개시한다.

Description

미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램{System and method for media management, and computer program for executing the method}
본 발명의 실시예들은 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램에 관한 것이다.
현 시대는 수많은 미디어가 실시간으로 생산되고 공유되는 미디어 홍수의 시대라고 불린다. 그러나 미디어의 양이 너무 많기 때문에, 사용자 혹은 서비스가 필요로 하는 내용을 포함하는 미디어를 선별하는 일이 매우 어렵다. 미디어의 내용에 관한 정제된 데이터가 있는 경우 미디어의 선별 및 이에 따른 미디어의 활용이 용이해질 것이다.
본 발명의 실시예들은, 컴퓨터를 이용하여 미디어를 자동으로 분석하여 미디어에 대응되는 메타데이터를 생성 및 저장하는 미디어 관리 방법, 시스템 및 컴퓨터 프로그램을 제공한다.
본 발명의 일 실시예는 컴퓨터를 이용하여, 텍스트 및 상기 텍스트에 대응되는 미디어의 구간 정보를 획득하고, 상기 텍스트 각각에 대하여, 상기 텍스트의 길이와 상기 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출하는 단계; 상기 제1 파라미터를 고려하여 상기 각 텍스트의 레벨을 결정하는 단계; 및 상기 각 텍스트의 레벨에 기초하여 상기 미디어의 레벨을 결정하는 단계;를 포함하는, 미디어 관리 방법을 개시한다.
일 실시예에 있어서, 상기 제1 파라미터는, 상기 미디어 구간의 단위 길이 당 상기 텍스트의 길이에 기초하여 결정될 수 있다.
일 실시예에 있어서 상기 산출하는 단계는, 상기 텍스트를 제1 단위로 분할하였을 때 1개 단위에 포함되는 단어의 개수에 기초하여 결정되는 제2 파라미터를 더 산출할 수 있고, 상기 텍스트의 레벨을 결정하는 단계는, 상기 제1 파라미터, 상기 제2 파라미터, 및 상기 제1 파라미터와 상기 제2 파라미터 각각에 대해 기설정된 가중치에 기초하여, 상기 각 텍스트의 레벨을 결정할 수 있다.
일 실시예에 있어서, 음성인식(TTS, text-to-speech) 모듈을 이용하여, 미디어에서 음성 및 상기 음성이 인식된 구간 정보를 추출하는 단계; 및 상기 미디어에 대응되는 텍스트를 획득하고, 상기 텍스트를 상기 추출된 음성과 매칭하고, 상기 매칭된 음성이 인식된 구간 정보를 상기 텍스트에 대응되는 미디어의 구간 정보로 결정하는 단계;를 더 포함할 수 있다.
일 실시예에 있어서, 상기 미디어의 레벨을 결정하는 단계는, 복수의 텍스트 각각에 대하여 결정된 레벨의 분포에서 하나 이상의 피크를 검출하고, 상기 피크에 해당하는 레벨에 기초하여 상기 미디어의 레벨을 결정할 수 있다.
일 실시예에 있어서, 상기 미디어의 레벨을 결정하는 단계는, 복수의 피크가 검출되는 경우, 상기 복수의 피크 각각의 크기에 기초하여 상기 복수의 피크 각각의 가중치를 결정할 수 있고, 상기 결정된 가중치에 따라 상기 복수의 피크 각각의 레벨 값을 가중치 합(weighted sum)하여 상기 미디어의 레벨을 결정할 수 있다.
일 실시예에 있어서, 상기 미디어의 레벨을 결정하는 단계는, 복수의 텍스트 각각에 대하여 결정된 레벨 중 가장 높은 레벨에 기초하여, 상기 미디어의 레벨을 상향 조정할 수 있다.
일 실시예에 있어서, 상기 미디어의 레벨 정보를 상기 미디어 및 상기 미디어의 식별정보 중 적어도 하나에 대한 메타데이터로서 저장하는 단계;를 더 포함할 수 있다.
일 실시예에 있어서, 상기 미디어의 레벨 정보 및 상기 텍스트 각각에 부여되는 레벨 정보 중 하나 이상을 포함하는 메타데이터를, 상기 미디어 또는 상기 미디어의 식별 정보와 연계하여 저장하는 단계;를 더 포함할 수 있다.
본 발명의 일 실시예는 전술한 일 실시예에 따른 방법을 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체를 개시한다.
본 발명의 일 실시예는 텍스트 및 상기 텍스트에 대응되는 미디어의 구간 정보를 획득하고, 상기 텍스트 각각에 대하여, 상기 텍스트의 길이와 상기 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출하고, 상기 제1 파라미터를 고려하여 상기 각 텍스트의 레벨을 결정하는 텍스트 레벨 결정부; 및 상기 각 텍스트의 레벨에 기초하여 상기 미디어의 레벨을 결정하는 미디어 레벨 결정부;를 포함하는, 미디어 관리 시스템을 개시한다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다. 이러한 일반적이고 구체적인 측면이 시스템, 방법, 컴퓨터 프로그램, 또는 어떠한 시스템, 방법, 컴퓨터 프로그램의 조합을 사용하여 실시될 수 있다.
본 발명의 실시예들에 관한 미디어 관리 방법, 시스템 및 컴퓨터 프로그램은, 미디어의 레벨을 결정함에 있어서, 미디어에 포함된 대사에 대응되는 텍스트의 길이와 해당 텍스트의 구간 정보를 고려하는 제1 파라미터와, 텍스트 자체만을 고려하는 제2 파라미터를 모두 반영하므로, 오디오화된 텍스트의 난이도를 높은 정확도로 산출할 수 있다.
본 발명의 실시예들에 관한 미디어 관리 방법, 시스템 및 컴퓨터 프로그램은, 미디어에 대응되는 메타데이터를 생성 및 저장하므로, 사용자 혹은 서비스가 메타데이터를 참조로 하여 원하는 미디어를 용이하게 선별할 수 있다.
본 발명의 실시예들에 관한 미디어 관리 방법, 시스템 및 컴퓨터 프로그램은, 미디어에 대응되는 메타데이터를 생성 및 저장하므로, 서비스는 미디어 메타데이터에 따라 미디어 관련 서비스를 차등화하여 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 미디어 관리 시스템을 도시한 것이다.
도 2는 본 발명의 일 실시예에 따른 미디어 관리 장치를 개략적으로 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 미디어 관리 방법을 개략적으로 도시한 흐름도이다.
도 4는 본 발명의 다른 실시예에 따른 미디어 관리 방법을 개략적으로 도시한 흐름도이다.
도 5는 텍스트의 레벨 분포의 일 예를 도시한 것이다.
도 6는 텍스트의 레벨 분포의 다른 예를 도시한 것이다.
도 7은 본 발명의 다른 실시예에 따른 미디어 관리 장치(100')를 개략적으로 도시한 흐름도이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 두께는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.
도 1은 본 발명의 일 실시예에 따른 미디어 관리 시스템을 도시한 것이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 미디어 관리 시스템은, 미디어 관리 서버(10), 미디어 제공 서버(20) 및 단말(30)을 포함할 수 있다. 미디어 관리 서버(10), 미디어 제공 서버(20) 및 단말(30)은 네트워크(40)를 통해 데이터를 송/수신할 수 있다.
미디어는 디지털 코드를 기반으로 동작하는 전자 매체로서, 본 명세서에서는 오디오 성분을 포함하는 디지털 컨텐츠를 의미하는 것일 수 있다. 예컨대 미디어는 오디오 또는 비디오를 포함하는 컨텐츠를 의미할 수 있다. 미디어에 포함된 오디오는, 음성(speech)을 포함할 수 있다. 미디어는 어학 교육용으로 활용될 수 있다.
일 실시예에 따른 미디어 제공 서버(20)는, 데이터베이스에 미디어를 저장하고, 저장된 미디어를 웹 링크를 통해 제공할 수 있다. 미디어 제공 서버(20)는, 미디어를 업로드하고 업로드된 미디어를 시청하는 미디어 공유 서비스를 제공하는 서버로서, 예컨대 유투브(youtube) 등의 동영상 공유 사이트를 운영하는 서버일 수 있다.
일 실시예에 따른 미디어 관리 서버(10)는 미디어에 관한 메타데이터를 관리할 수 있다. 일 예에 따르면 미디어 관리 서버(10)는, 자체적으로 데이터베이스에 저장된 미디어 및 이에 관한 메타데이터를 관리할 수 있다. 미디어 관리 서버(10)는 미디어 및 메타데이터를 함께 저장할 수 있다. 일 예에 따르면 미디어 관리 서버(10)는 별도의 미디어 제공 서버(20)에서 제공하는 미디어에 관한 메타데이터를 관리할 수 있고, 미디어 제공 서버(20)에서 제공하는 미디어의 링크와 함께 메타데이터를 저장할 수 있다.
미디어 관리 서버(10)는 미디어에 관한 메타데이터를 이용하여, 미디어와 관련된 서비스를 단말(30)에 제공할 수 있다. 메타데이터는 미디어를 이용하는 학습에 활용될 수 있는 데이터들을 포함할 수 있다. 메타데이터는 미디어에 포함된 음성의 난이도에 따라 결정되는 미디어의 레벨 정보를 포함할 수 있다. 메타데이터는 미디어에 포함된 복수 구간들 또는 각 구간에 대응되는 텍스트 각각에 부여되는 레벨 정보를 더 포함할 수 있다. 미디어 관리 서버(10)는 미디어의 레벨을 참조하여, 레벨에 따라 차등화된 서비스를 단말(30)에 제공할 수 있다. 미디어 관리 서버(10)는 미디어의 복수 구간들 또는 이에 대응되는 텍스트의 레벨을 참조하여, 구간 별로 다른 방법을 적용하여 서비스를 제공하거나, 복수 구간의 레벨 분포에 대한 정보를 시각화하여 제공하는 등의 서비스를 제공할 수 있다.
단말(30)은 PC, 스마트폰(smart phone), 태블릿(tablet), 노트북 등으로, 미디어 관리 서버(10) 및/또는 미디어 제공 서버(20)와 관련된 웹/모바일 사이트의 접속 또는 서비스 전용 어플리케이션(이하, '서비스 앱'이라 칭함)의 설치 및 실행이 가능한 모든 단말 장치를 의미할 수 있다. 단말(30)은 웹/모바일 사이트의 접속 또는 서비스 앱의 제어 하에 서비스 화면 구성, 데이터 입력, 데이터 송수신, 데이터 저장 등 서비스 전반의 동작을 수행할 수 있다. 도 1에는 하나의 단말(30)이 도시되었으나, 복수의 단말이 존재할 수 있다.
도 1에는 도시되지 않았으나 미디어 관리 서버(10) 및 미디어 제공 서버(20)는 메모리, 입/출력부, 통신부, 프로그램 저장부, 제어부 등을 포함할 수 있다. 메모리는 서버가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 메모리는 자기 저장 매체(magnetic storage media) 또는 플래시 저장 매체(flash storage media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다. 통신부는 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다. 제어부는 프로세서(processor)와 같이 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
네트워크(40)는 단말(30), 미디어 관리 서버(10), 미디어 제공 서버(20)를 연결하는 역할을 수행한다. 네트워크(40)는 사용자 단말(200, 300)이 서버(100)에 접속한 후 패킷 데이터를 송수신할 수 있도록 접속 경로를 제공한다. 네트워크(40)는 예컨대 LANs(Local Area Networks), WANs(Wide Area Networks), MANs(Metropolitan Area Networks), ISDNs(Integrated Service Digital Networks) 등의 유선 네트워크나, 무선 LANs, CDMA, 블루투스, 위성 통신, 3G, 4G, 5G, LTE 등의 무선 네트워크를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
도 2는 본 발명의 일 실시예에 따른 미디어 관리 장치를 개략적으로 도시한 블록도이다.
미디어 관리 장치(100)는 미디어 관리 서버(10) 및/또는 미디어 제공 서버(20)에 저장된 미디어의 메타데이터를 생성하여 저장할 수 있다. 도 2를 참조하면, 미디어 관리 장치(100)는 텍스트 레벨 결정부(110) 및 미디어 레벨 결정부(120)를 포함할 수 있다.
도 3은 본 발명의 일 실시예에 따른 미디어 관리 방법을 개략적으로 도시한 흐름도이다. 도 3에 도시된 흐름도는 도 2에 도시된 미디어 관리 장치(100)에서 시계열적으로 처리되는 단계들로 구성될 수 있다. 따라서 이하에서는 도 2와 도 3을 함께 참조하여 본 발명의 실시예들을 설명한다.
텍스트 레벨 결정부(110)는 미디어에 대응되는 하나 이상의 텍스트 각각에 대한 레벨을 결정할 수 있다. 미디어 레벨 결정부(120)는 텍스트 레벨 결정부(110)에 의해 결정된 텍스트의 레벨에 기초하여, 미디어의 레벨을 결정할 수 있다.
상세히 단계 31에서 텍스트 레벨 결정부(110)는, 텍스트 및 텍스트에 대응되는 미디어의 구간 정보를 획득할 수 있다. 여기서 텍스트는, 미디어에 대응되는 정보로서, 미디어에 포함된 음성(speech)에 대응되는 데이터일 수 있다. 다만 본 발명이 이에 한정하는 것은 아니고, 텍스트는 미디어에 표시효과로서 삽입된 자막에 대응되는 데이터를 포함할 수 있다.
일 예에 따른 텍스트 레벨 결정부(110)는 미디어에 대응되어 별도의 파일로 기생성된 자막 데이터로부터 텍스트 및 미디어 구간 정보를 획득할 수 있다. 예컨대, 자막 데이터는 자막 및 해당 자막의 표시 구간 정보를 포함할 수 있고, 텍스트 레벨 결정부(110)는 자막 데이터의 자막을 텍스트로, 자막 데이터의 표시 구간 정보를 미디어 구간 정보로 획득할 수 있다. 표시 구간 정보는, 자막의 표시를 시작하는 시점과 종료하는 시점을 포함할 수 있다.
일 예에 따른 텍스트 레벨 결정부(110)는 음성인식(TTS, text-to-speech) 모듈을 이용하여 미디어에서 음성(speech)을 인식함으로써, 인식된 음성 및 해당 음성이 인식된 구간 정보를 텍스트 및 미디어 구간 정보로서 획득할 수 있다.
일 예에 따른 텍스트 레벨 결정부(110)는 텍스트 정보를 획득한 후, 음성인식 모듈을 이용하여 텍스트에 대응되는 미디어의 구간 정보를 획득할 수 있다. 예를 들어, 텍스트 레벨 결정부(110)는 미디어에 포함된 대사들에 대응되는 텍스트 정보만을 이에 대응되는 미디어 구간 정보 없이 먼저 획득할 수 있고, 음성인식 모듈에 의해 추출된 음성과 매칭하여, 매칭된 음성이 인식된 구간 정보를 이용하여 텍스트에 대응되는 미디어 구간 정보를 추가로 생성할 수 있다.
예컨대, 미디어에 대응되는 텍스트를 사람 내지 사용자로부터 직접 입력 받는 경우, 정확도가 높은 텍스트를 획득할 수 있다는 장점이 있으나, 텍스트에 대응되는 미디어의 구간 정보를 사람이 직접 입력하는 것은 사용자에게 매우 번거롭고 불편할 수 있다. 반면, 음성인식 모듈을 이용하여 미디어로부터 텍스트를 추출하게 되면, 텍스트가 추출된 구간 정보를 함께 자동으로 추출할 수 있는 장점이 있으나, 텍스트의 정확도가 낮다는 단점이 있다.
일 예에 따른 텍스트 레벨 결정부(110)는 별도로 획득한 제1 텍스트와 음성인식 모듈에 의해 추출된 제2 텍스트를 기설정된 오차범위 이내에서 매칭할 수 있고, 제1 텍스트에 매칭된 제2 텍스트가 추출된 구간 정보를, 제1 텍스트에 대응되는 미디어 구간 정보로 결정할 수 있다. 이에 따르면 텍스트 레벨 결정부(110)는 높은 정확도의 텍스트를 획득할 수 있고, 이에 대응되는 미디어 구간 정보를 빠르게 획득할 수 있다. 텍스트 레벨 결정부(110)는 제1 텍스트 및 이에 대응되는 미디어 구간 정보, 즉 제2 텍스트가 추출된 구간 정보를 기초로 하여 제1 텍스트의 레벨을 결정할 수 있다.
일 예에 따른 텍스트 레벨 결정부(110)는 영상에서 텍스트를 추출하는 문자인식 모듈을 이용하여 미디어의 영상 성분에서 문자를 인식함으로써, 인식된 문자 및 해당 문자가 인식된 구간 정보를 텍스트 및 미디어 구간 정보로서 획득할 수 있다. 일 예에 따른 텍스트 레벨 결정부(110)는 문자인식 모듈을 통해 획득한 텍스트 및 구간 정보를, 전술한 방법들에 의해 획득된 텍스트 및 구간 정보 외에 추가적으로 더 획득할 수 있다. 즉, 텍스트 레벨 결정부(110)는 전술한 방법들에 의해 획득한 텍스트 및 구간 정보와, 문자인식 모듈을 통해 획득한 텍스트 및 구간 정보를 모두 대상으로 하여, 텍스트의 레벨을 결정할 수 있다.
단계 31에서 일 실시예에 따른 텍스트 레벨 결정부(110)는 텍스트 각각에 대하여 텍스트의 길이와 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출할 수 있다. 제1 파라미터는 미디어에서의 발화(utterance) 속도에 대응되는 개념일 수 있다. 텍스트 레벨 결정부는, 단위 텍스트에 대하여 각각 제1 파라미터를 산출할 수 있다. 일 예에 따르면 단위 텍스트는 연속된 하나의 구간 정보에 대응되는 텍스트 묶음을 의미하는 것일 수 있다.
텍스트 레벨 결정부(110)는, 미디어 구간의 단위 길이 당 텍스트의 길이에 기초하여 제1 파라미터를 산출할 수 있다. 텍스트의 길이는, 텍스트에 포함된 단어(word)의 수일 수 있다. 예컨대 텍스트 레벨 결정부(110)는 텍스트에 포함된 단어의 수(words)를 텍스트에 대응되는 구간의 길이(min)로 나누어 제1 파라미터를 산출할 수 있다. 텍스트 레벨 결정부(110)는 텍스트에 포함된 문자열 중 스페이스(space)를 포함하지 않는 연속된 문자열을 하나의 단어로 인식할 수 있다.
단계 32에서 텍스트 레벨 결정부(110)는, 텍스트 및/또는 텍스트에 대응되는 구간의 길이에 따라 결정되는 하나 이상의 파라미터를 기반으로, 각 텍스트의 레벨을 부여할 수 있다. 예컨대 텍스트 레벨 결정부(110)는, 단계 31에서 산출된 제1 파라미터를 기반으로, 각 텍스트의 레벨을 부여할 수 있다. 예를 들어, 텍스트 레벨 결정부(110)는 제1 파라미터 값의 구간 별로 레벨 정보를 할당하는 룩업테이블 및/또는 기설정된 규칙을 참조하여 각 텍스트의 제1 파라미터로부터 레벨을 결정할 수 있다.
단계 33에서 미디어 레벨 결정부(120)는, 미디어에 대응되는 하나 이상의 텍스트 각각에 대하여 결정된 텍스트 레벨에 기초하여, 미디어에 대한 레벨을 결정할 수 있다. 미디어 레벨 결정부(120)는, 각 텍스트에 대해 부여된 레벨 전체를 반영할 수 있는 대표 레벨을 미디어의 레벨로 결정할 수 있다. 일 예에 따르면 미디어 레벨 결정부(120)는 각 텍스트에 대해 부여된 레벨 전체의 평균값을 미디어의 레벨로 결정할 수 있다. 일 예에 따르면 미디어 레벨 결정부(120)는 텍스트 레벨의 분포에 기초하여 미디어의 레벨을 결정할 수 있다. 미디어 레벨 결정부(120)는 텍스트 각각에 대해 결정된 레벨의 분포에서 하나 이상의 피크를 검출하고, 피크에 해당하는 레벨을 미디어의 레벨로 결정할 수 있다. 피크는, 레벨에 해당하는 텍스트의 수가 가장 많은 지점을 의미할 수 있다.
미디어 레벨 결정부(120)는, 결정된 미디어 레벨 정보를 미디어 관리 서버(10)에 의해 관리되는 데이터베이스(미도시)에 저장할 수 있다. 해당 데이터베이스는 미디어 관리 서버(10)에 포함된 데이터베이스이거나, 미디어 관리 서버(10)에 의해 접근 가능한 별도의 데이터베이스일 수 있다. 미디어 레벨 결정부(120)는 결정된 미디어 레벨 정보를, 미디어 및 상기 미디어의 식별정보 중 적어도 하나에 대한 메타데이터로서 저장할 수 있다. 미디어의 식별정보는 미디어를 시청할 수 있는 웹 링크일 수 있다. 미디어 레벨 결정부(120)는 각 텍스트 정보, 각 텍스트에 대응되는 미디어의 구간 정보, 및 각 텍스트의 레벨 정보 중 하나 이상을 메타데이터에 함께 저장할 수 있다.
도 3에 도시되지 않았으나, 단계 33 이후에 서비스 제공부(130)는, 미디어 레벨 결정부(120)에 의해 저장된 메타데이터를 참조하여, 미디어를 이용한 서비스를 제공할 수 있다. 서비스 제공부(130)는 미디어와 연관된 서비스를 제공함에 있어서 텍스트 레벨 및/또는 미디어의 레벨에 따라 차별화된 서비스를 제공할 수 있다. 서비스 제공부(130)는 미디어 또는 미디어를 제공하는 링크와 함께 전술한 서비스를 제공할 수 있다.
서비스 제공부(130)는, 자체적으로 저장된 미디어 또는 외부 서버에 저장된 미디어의 링크와 함께 전술한 미디어 이용 서비스를 단말(30)에 제공할 수 있다. 미디어의 링크가 단말(30)에 제공되는 경우 단말(30)은 외부 서버를 통해 미디어를 제공받을 수 있다.
도 4는 본 발명의 다른 실시예에 따른 미디어 관리 방법을 개략적으로 도시한 흐름도이다.
도 4에 도시된 흐름도는 도 2에 도시된 미디어 관리 장치(100)에서 시계열적으로 처리되는 단계들로 구성될 수 있다. 따라서 이하에서는 도 2와 도 4를 함께 참조하여 본 발명의 실시예들을 설명한다.
단계 41에서, 텍스트 레벨 결정부(110)는, 전술한 제1 파라미터 이외에 제2 파라미터를 더 산출할 수 있다. 일 예에 따르면 텍스트 레벨 결정부(110)는 텍스트 각각에 대하여 텍스트를 제1 단위로 분할하였을 때 1개 단위에 포함되는 단어의 개수에 기초하여 결정되는 제2 파라미터를 산출할 수 있다. 제1 단위는, 문장부호(마침표, ".")에 의해 구분되는 문장 단위를 의미할 수 있다. 즉, 텍스트 레벨 결정부(110)는 문장에 포함된 단어의 개수에 기초하여 제2 파라미터를 산출할 수 있다. 제2 파라미터는 문장의 난이도에 대응되는 개념일 수 있다. 텍스트 레벨 결정부(110)는 텍스트에 포함된 단어의 수를 문장의 수로 나누어 제2 파라미터를 산출할 수 있다. 텍스트 레벨 결정부(110)는 텍스트에 복수의 문장이 포함된 경우 문장 별로 부분 파라미터를 각각 산출한 후, 부분 파라미터들로부터 텍스트에 대응되는 제2 파라미터 값을 산출할 수 있다. 텍스트 레벨 결정부(110)는 단위 텍스트를 하나의 문장인 것으로 가정하여 제2 파라미터를 산출할 수도 있다. 즉, 각 텍스트가 1개 단위로 이루어진 것으로 가정하여 제2 파라미터를 산출할 수도 있다.
텍스트 레벨 결정부(110)는 다음의 수학식 1에 따라 제2 파라미터를 산출할 수 있다.
Figure 112017119223538-pat00001
여기서,
Figure 112017119223538-pat00002
는 제2 파라미터,
Figure 112017119223538-pat00003
,
Figure 112017119223538-pat00004
,
Figure 112017119223538-pat00005
는 상수,
Figure 112017119223538-pat00006
는 텍스트에 포함된 단어 수,
Figure 112017119223538-pat00007
는 텍스트에 포함된 제1 단위의 수, 예컨대 텍스트에 포함된 문장 수,
Figure 112017119223538-pat00008
는 텍스트에 포함된 음절 수를 의미한다. 음절은 발화의 단위로, 음절의 수는 모음의 수에 대응될 수 있다. 여기서의 모음은, 둘 이상의 이중 모음을 포함한다.
상수는 파라미터 산출 모델의 설계에 따라 다양하게 설정될 수 있다. 예컨대 K1은 20.6835, K2는 -1.015, K3은 -84.6일 수 있다. 또는 K1은 -15.59, K2는 0.39, K3는 11.8일 수 있다.
일 실시예에 따르면, 텍스트 레벨 결정부(110)는 전술한 수학식 1 이외에 다른 알고리즘을 사용하거나, 복수의 알고리즘의 계산 결과를 조합하여, 제2 파라미터를 산출할 수 있다. 텍스트 레벨 결정부(110)는 복수의 알고리즘에 따른 계산값을 정규화한 후 가중치합하여 제2 파라미터를 산출할 수 있다. 텍스트 레벨 결정부(110)는 전술한 수학식 1 의 계산 결과 이외에, 문장의 가독성을 수치화할 수 있는 Gunning Fog scoring 알고리즘에 따른 계산 결과, 동일 단어의 중복 등장 빈도, 단어 및 음절 수를 더 고려하여 텍스트에 대한 제2 파라미터를 최종 결정할 수 있다. 텍스트 레벨 결정부(110)는 복수의 알고리즘에 따른 계산값 각각에 기초하여 결정되는 가중치로 복수의 알고리즘에 따른 계산값을 가중치 합하여 제2 파라미터를 산출할 수 있다.
일 예에 따르면, 텍스트 레벨 결정부(110)는 제1 파라미터에 따라 제2 파라미터의 산출 알고리즘을 조정할 수 있다. 텍스트 레벨 결정부(110)는 제1 파라미터에 기초하여, 전술한 제2 파라미터를 산출하기 위한 복수의 알고리즘에 따른 계산값들의 기설정된 가중치를 조정할 수 있다. 예를 들어, 제1 파라미터가 클수록 듣기 난이도가 높은 것을 의미할 수 있고, 텍스트 레벨 결정부(110)는 제1 파라미터가 클수록 제2 파라미터를 산출하기 위한 복수의 알고리즘 중 음절 수를 변수로 갖는 알고리즘의 가중치를 상향 조정할 수 있다.
일 실시예에 따르면, 텍스트 레벨 결정부(110)는 텍스트에 포함된 단어 중 기저장된 단어와 매칭되는 단어를 제외한 단어의 개수에 기초하여 제2 파라미터를 결정할 수 있다. 기저장된 단어는 난이도가 매우 낮은 단어들을 포함할 수 있다. 기저장된 단어와 매칭되는 단어는, 기저장된 단어와 동일한 단어, 기저장된 단어가 특정 규칙에 의해 변형된 단어를 포함할 수 있다.
단계 42에서 텍스트 레벨 결정부(110)는 텍스트에 대응되는 제1 파라미터 및 제2 파라미터를 모두 고려하여, 텍스트의 레벨을 결정할 수 있다. 텍스트 레벨 결정부(110)는 제1 파라미터와 제2 파라미터 각각에 대해 기설정된 가중치에 기초하여, 제1 파라미터와 제2 파라미터를 가중치 합하여 텍스트의 레벨을 결정할 수 있다. 텍스트 레벨 결정부(110)는 서로 다른 범위의 값을 갖는 제1 파라미터와 제2 파라미터를 정규화한 후에 가중치 합하여 텍스트의 레벨을 결정할 수 있다. 이를 위하여, 미디어 관리 장치(100)는 제1 파라미터와 제2 파라미터의 구간 범위 정보를 미리 저장하고 있을 수 있다. 텍스트 레벨 결정부(110)는 기저장된 제1 파라미터와 제2 파라미터의 구간 범위를 참조하여, 제1 파라미터와 제2 파라미터를 동일한 구간에서의 값으로 정규화한 후에, 가중치 합하여 텍스트 레벨을 결정할 수 있다. 가중치가 동일한 경우 텍스트 레벨 결정부(110)는 제1 파라미터 및 제2 파라미터를 정규화한 값을 평균하여 텍스트 레벨을 결정할 수 있다.
텍스트 레벨 결정부(110)는, 미디어의 전체 길이, 미디어 내의 전체 텍스트의 길이에 기초하여, 제1 파라미터 및 제2 파라미터의 가중치를 결정할 수 있다. 제1 파라미터는 텍스트에 대응되는 시간 구간의 길이를 고려하여 결정함에 따라 "리스닝"의 난이도가 반영될 수 있고, 제2 파라미터는 텍스트에 대응되는 시간 구간의 길이를 고려되지 않고 결정되므로 문장 자체의 난이도, 예컨대 가독성이 반영될 수 있다. 텍스트 레벨 결정부(110)는 미디어의 전체 길이, 미디어 내의 텍스트의 길이가 길수록, 제1 파라미터의 가중치를 제2 파라미터의 가중치보다 높게 결정할 수 있다.
이와 같이 텍스트 레벨 결정부(110)는 미디어에 포함된 대사에 대응되는 텍스트의 길이와 해당 텍스트의 구간 정보를 고려하는 제1 파라미터와, 텍스트 자체만을 고려하는 제2 파라미터를 모두 반영하여, 오디오화된 텍스트의 난이도에 해당하는 레벨을 높은 정확도로 산출할 수 있다.
단계 43은 도 3의 단계 33의 처리와 동일할 수 있으며, 이상에서 도 3의 단계 33에 대하여 설명한 내용이 도 4의 단계 43에 동일하게 적용될 수 있다.
도 5는 텍스트의 레벨 분포의 일 예를 도시한 것이다.
도 5는 일 미디어에 포함된 대사들에 대응되는 복수의 텍스트 각각에 대하여 결정한 레벨들의 분포를 도시한 그래프이다. 도 5를 참조하면, 가로축은 텍스트의 레벨 값이고, 세로축은 각 레벨에 해당하는 텍스트의 수에 해당한다. 도 5를 참조하면, 본 미디어에 포함된 대사들에 대응되는 텍스트는 레벨 "-12"부터 레벨 "18"까지, 다양한 레벨 범위에 해당되는 것을 볼 수 있다. 도 5의 가로축에 도시된 텍스트의 레벨의 실제 값은 예시일 뿐이므로 본 발명이 이에 한정되지 않으며, 레벨의 실질적인 값은 파라미터의 정규화 방법 및 파라미터 값으로부터 텍스트의 레벨을 계산하는 방법의 설계에 따라 달라질 수 있다.
도 5를 참조하면, 미디어 레벨 결정부(120)는 복수의 텍스트 각각에 대하여 결정된 레벨의 분포에서 하나 이상의 피크(51)를 검출하고, 피크(51)에 해당하는 레벨에 기초하여 상기 미디어의 레벨을 결정할 수 있다. 도 5에서는 레벨 "-5"에 대응되는 텍스트가 가장 많기 때문에, 미디어 레벨 결정부(120)는 피크(51)에 대응되는 레벨인 "-5" 레벨을 미디어의 레벨로 결정할 수 있다.
도 6는 텍스트의 레벨 분포의 다른 예를 도시한 것이다.
도 6을 참조하면, 일 미디어에 포함된 대사들에 대응되는 복수의 텍스트 각각에 대하여 결정한 레벨들의 분포의 다른 예가 도시되었다. 도 6에 따르면, 텍스트 레벨의 분포는 둘 이상의 피크를 가질 수 있다.
일 실시예에 따르면 미디어 레벨 결정부(120)는, 복수의 텍스트 각각에 대해 결정된 레벨의 분포에서 기설정된 확률 모델을 피팅(fitting)하고, 기설정된 확률 모델에 피팅된 구간 각각에서 피크를 검출하고, 검출된 하나 이사의 피크에 기초하여 미디어의 레벨을 결정할 수 있다. 확률 모델은 가우시안 모델일 수 있고, 가우시안 모델 피팅을 위해 가우시안 믹스쳐 모델이 사용될 수 있다.
도 6을 참조하면, 텍스트 레벨의 분포에 두 개의 가우시안 모델(61, 62)이 피팅된 예가 도시되었다. 미디어 레벨 결정부(120)는 텍스트 레벨의 분포에 피팅된 모델(61, 62) 각각의 피크(611, 612)에 해당하는 레벨에 기초하여 미디어의 레벨을 결정할 수 있다. 예를 들어, 미디어 레벨 결정부(120)는 제1 모들(61)의 제1 피크(611)의 레벨 값인 "-5"와 제2 모델(62)의 제2 피크(621)의 레벨 값인 "20"의 평균값을 미디어의 레벨로 결정할 수 있다.
다른 예에 따르면, 미디어 레벨 결정부(120)는 복수의 피크 각각의 레벨 값을 가중치 합(weighted sum)하여 미디어의 레벨을 결정할 수 있고, 미디어 레벨 결정부(120)는 각 피크의 크기, 즉 각 피크에 해당하는 표본(텍스트)의 개수에 대응하여 각 피크의 가중치를 결정할 수 있다. 이 경우 미디어 레벨 결정부(120)는 다음의 수학식 2에 따라 미디어의 레벨을 결정할 수 있다.
Figure 112017119223538-pat00009
여기서
Figure 112017119223538-pat00010
은 미디어의 레벨,
Figure 112017119223538-pat00011
은 제1 피크(611)의 레벨(도 6의 예에서 "-5"),
Figure 112017119223538-pat00012
는 제2 피크(621)의 레벨(도 6의 예에서 "20"),
Figure 112017119223538-pat00013
은 제1 피크(611)의 레벨에 해당하는 텍스트의 개수(도 6의 예에서 12),
Figure 112017119223538-pat00014
는 제2 피크(621)에 해당하는 텍스트의 개수(도 6의 예에서 6)에 해당할 수 있다.
한편 미디어 레벨 결정부(120)는 각 피크에 해당하는 표본의 개수뿐 아니라, 각 피크의 레벨 값을 더 고려하여 각 피크의 가중치를 결정하고, 결정된 가중치에 따라 각 피크의 레벨 값을 가중치 합하여 미디어의 레벨을 결정할 수 있다. 미디어 레벨 결정부(120)는 각 피크의 레벨 값이 클수록 각 피크의 가중치를 더 크게 결정할 수 있다. 미디어 레벨 결정부(120)는 각 피크의 레벨 값을 가중치에 반영하기 위해, 레벨 값의 범위를 0~1 사이의 값으로 정규화하여 사용할 수 있다.
일 실시예에 따르면, 미디어 레벨 결정부(120)는 전술한 방법들에 의하여 미디어의 레벨을 1차로 결정한 후에, 미디어에 대응되는 복수의 텍스트 각각에 대해 결정된 레벨 중 가장 높은 레벨에 기초하여, 미디어의 레벨을 상향 조정하여 미디어의 레벨을 2차로 결정할 수 있다.
도 6의 예에서, 가장 높은 레벨은 "14"에 해당하므로, 미디어 레벨 결정부(120)는 복수의 텍스트 각각에 대해 결정된 레벨들 중 1개 이상의 표본을 갖는 최고 레벨(63)에 해당하는 값 "14"에 기초하여 미디어의 레벨을 상향조정할 수 있다. 미디어 레벨 결정부(120)는 1차로 결정된 미디어의 레벨 값과 최고 레벨(63)의 값을 비교한 결과에 따라, 미디어 레벨의 상향 조정 정도를 결정할 수 있다. 예를 들어 미디어 레벨 결정부(120)는 1차로 결정된 미디어 레벨 값과 최고 레벨(63)의 값의 차이 및/또는 그러한 차이와 1차로 결정된 미디어 레벨 값의 비율이 클수록, 미디어 레벨을 크게 상향조정할 수 있다. 이와 같은 처리에 의하여, 미디어 레벨 결정부(120)는 레벨이 높은 텍스트가 미디어에 하나라도 포함되어 있으면 그러한 미디어의 난이도를 사용자가 체감상 높게 느낄 수 있는 특성을 반영할 수 있다.
일 실시예에 따른 미디어 레벨 결정부(120)는, 하나의 미디어에 대하여 복수의 레벨을 부여할 수 있다. 도 6의 예와 같이 하나의 미디어에 포함된 복수 텍스트들의 레벨 분포에서 2개 이상의 모델이 피팅되어 2개 이상의 피크가 검출된 경우, 각 피크에 대응되는 레벨들 각각에 기초하여 결정되는 미디어의 레벨들을 모두를 해당 미디어에 대한 복수의 레벨로 결정할 수 있다.
미디어 레벨 결정부(120)는 미디어에 대응되는 복수의 레벨 각각에 해당하는 텍스트 정보를 연관하여 메타데이터로 저장할 수 있다. 예를 들어 미디어 레벨 결정부(120)가 제1 피크(611)에 기초하여 결정되는 제1 레벨 및 제2 피크(621)에 기초하여 결정되는 제2 레벨을 미디어의 레벨로 결정한 경우, 미디어 레벨 결정부는, 제1 모델(61)에 포함되는 텍스트 정보를 제1 레벨과 연관하여 저장하고, 제2 모델(62)에 포함되는 텍스트 정보를 제2 레벨과 연관하여 저장할 수 있다.
일 실시예에 따른 서비스 제공부(130)는, 미디어 기반 서비스를 제공할 때 미디어의 복수 레벨 중 어느 하나의 레벨과 연관된 텍스트만을 선별하여, 어느 하나의 레벨에 특화된 서비스를 제공할 수 있다. 예컨대 서비스 제공부(130)는 미디어의 제1 레벨에 연관된 텍스트와 제2 레벨에 연관된 텍스트에 대하여 다른 방법으로 서비스를 제공할 수 있다.
도 7은 본 발명의 다른 실시예에 따른 미디어 관리 장치(100')를 개략적으로 도시한 흐름도이다.
도 7을 참조하면, 미디어 관리 장치(100')는 채널 레벨 결정부(140)를 더 포함할 수 있다.
일 실시예에 따르면 채널 레벨 결정부(140)는 미디어가 소속된 채널 정보를 미디어 제공 서버(20)로부터 획득할 수 있고, 미디어 레벨 결정부(120)에 의해 결정된 미디어 레벨에 기초하여, 해당 미디어가 소속된 채널의 레벨을 결정할 수 있다. 채널 레벨 결정부(140)는 결정된 채널의 레벨을, 채널 식별 정보와 함께 자체 데이터베이스, 혹은 미디어 관리 서버(10)에서 접근 가능한 데이터베이스에 저장할 수 있다.
서비스 제공부(130)는, 채널에 대한 정보를 사용자에게 제공할 수 있다. 채널에 대한 정보는, 채널의 레벨 정보, 채널에 소속된 미디어들의 레벨 정보, 채널에 소속된 미디어들에 포함된 텍스트들의 레벨 정보 중 하나 이상을 포함할 수 있다.
전술한 실시예들에 있어서, 텍스트 레벨 결정부(110)는 미디어 제공 서버(20)에 업로드되는 미디어들의 링크를 주기적으로 수집하고, 텍스트 생산 장치(미도시)에 미디어 정보를 전송하여 텍스트 생산 장치(미도시)로부터 미디어에 대응되는 텍스트를 획득하는 방법으로, 미디어에 대응되는 텍스트를 획득할 수 있다.
전술한 실시예들에 따르면, 방대한 양의 인터넷 상의 미디어에 대하여 메타데이터를 자동으로 생성 및 저장함으로써, 방대한 양의 미디어를 활용하여 미디어 기반 서비스를 제공함에 있어서 미디어의 메타데이터를 이용하여 서비스의 종류, 로직 등을 변형할 수 있다.
전술한 도 2에 도시된 미디어 관리 장치(100) 및 도 7에 도시된 미디어 관리 장치(100')는 본 실시예의 특징이 흐려지는 것을 방지하기 위하여 본 실시예와 관련된 구성요소들만을 도시한 것이므로 도 2 및 도 7에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 본 실시예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
또한 도 2에 도시된 미디어 관리 장치(100) 및 도 7에 도시된 미디어 관리 장치(100')는 하나 이상의 프로세서(processor)에 해당하거나, 하나 이상의 프로세서를 포함할 수 있다. 이에 따라, 미디어 관리 장치(100, 100')는 마이크로 프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다. 미디어 관리 장치(100, 100')의 기능적인 블록들은 하나의 칩에 구현될 수도 있고, 둘 이상의 칩에 분리되어 구현될 수도 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 발명은 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 본 발명에의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 발명은 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 발명은 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "요소", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
한편, 도 3 및 도 4에 도시된 본 발명의 일 실시예에 따른 미디어 관리 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있으며, 균등한 다른 실시 예가 가능함을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
10: 미디어 관리 서버
20: 미디어 제공 서버
30: 단말
40: 네트워크
100: 미디어 관리 장치
110: 텍스트 레벨 결정부
120: 미디어 레벨 결정부
130: 서비스 제공부

Claims (11)

  1. 컴퓨터를 이용하여,
    텍스트 및 상기 텍스트에 대응되는 미디어의 구간 정보를 획득하고, 상기 텍스트 각각에 대하여, 상기 텍스트의 길이와 상기 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출하는 단계;
    상기 제1 파라미터를 고려하여 상기 각 텍스트의 레벨을 결정하는 단계; 및
    상기 각 텍스트의 레벨에 기초하여 상기 미디어의 레벨을 결정하는 단계;를 포함하고,
    상기 산출하는 단계는, 상기 텍스트를 제1 단위로 분할하였을 때 1개 단위에 포함되는 단어의 개수에 기초하여 결정되는 제2 파라미터를 더 산출하고,
    상기 텍스트의 레벨을 결정하는 단계는,
    상기 제1 파라미터, 상기 제2 파라미터, 및 상기 제1 파라미터와 상기 제2 파라미터 각각에 대해 기설정된 가중치에 기초하여, 상기 각 텍스트의 레벨을 결정하는,
    미디어 관리 방법.
  2. 제1 항에 있어서,
    상기 제1 파라미터는, 상기 미디어 구간의 단위 길이 당 상기 텍스트의 길이에 기초하여 결정되는,
    미디어 관리 방법.
  3. 삭제
  4. 제1 항에 있어서,
    음성인식(TTS, text-to-speech) 모듈을 이용하여, 미디어에서 음성 및 상기 음성이 인식된 구간 정보를 추출하는 단계; 및
    상기 미디어에 대응되는 텍스트를 획득하고, 상기 텍스트를 상기 추출된 음성과 매칭하고, 상기 매칭된 음성이 인식된 구간 정보를 상기 텍스트에 대응되는 미디어의 구간 정보로 결정하는 단계;를 더 포함하는
    미디어 관리 방법.
  5. 제1 항에 있어서,
    상기 미디어의 레벨을 결정하는 단계는,
    복수의 텍스트 각각에 대하여 결정된 레벨의 분포에서 하나 이상의 피크를 검출하고, 상기 피크에 해당하는 레벨에 기초하여 상기 미디어의 레벨을 결정하는
    미디어 관리 방법.
  6. 제5 항에 있어서,
    상기 미디어의 레벨을 결정하는 단계는,
    복수의 피크가 검출되는 경우, 상기 복수의 피크 각각의 크기에 기초하여 상기 복수의 피크 각각의 가중치를 결정하고,
    상기 결정된 가중치에 따라 상기 복수의 피크 각각의 레벨 값을 가중치 합(weighted sum)하여 상기 미디어의 레벨을 결정하는,
    미디어 관리 방법.
  7. 제5 항에 있어서,
    상기 미디어의 레벨을 결정하는 단계는,
    복수의 텍스트 각각에 대하여 결정된 레벨 중 가장 높은 레벨에 기초하여, 상기 미디어의 레벨을 상향 조정하는,
    미디어 관리 방법.
  8. 제1 항에 있어서,
    상기 미디어의 레벨 정보를 상기 미디어 및 상기 미디어의 식별정보 중 적어도 하나에 대한 메타데이터로서 저장하는 단계;를 더 포함하는,
    미디어 관리 방법.
  9. 제1 항에 있어서,
    상기 미디어의 레벨 정보 및 상기 텍스트 각각에 부여되는 레벨 정보 중 하나 이상을 포함하는 메타데이터를, 상기 미디어 또는 상기 미디어의 식별 정보와 연계하여 저장하는 단계;를 더 포함하는,
    미디어 관리 방법.
  10. 제1항 내지 제2항, 제4항 내지 제9항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체.
  11. 텍스트 및 상기 텍스트에 대응되는 미디어의 구간 정보를 획득하고, 상기 텍스트 각각에 대하여, 상기 텍스트의 길이와 상기 텍스트에 대응되는 미디어 구간의 길이를 비교한 결과에 따라 결정되는 제1 파라미터를 산출하고, 상기 제1 파라미터를 고려하여 상기 각 텍스트의 레벨을 결정하는 텍스트 레벨 결정부; 및
    상기 각 텍스트의 레벨에 기초하여 상기 미디어의 레벨을 결정하는 미디어 레벨 결정부;를 포함하고,
    상기 텍스트 레벨 결정부는, 상기 텍스트를 제1 단위로 분할하였을 때 1개 단위에 포함되는 단어의 개수에 기초하여 결정되는 제2 파라미터를 더 산출하고,
    상기 미디어 레벨 결정부는 상기 제1 파라미터, 상기 제2 파라미터, 및 상기 제1 파라미터와 상기 제2 파라미터 각각에 대해 기설정된 가중치에 기초하여, 상기 각 텍스트의 레벨을 결정하는,
    미디어 관리 시스템.
KR1020170161838A 2017-11-29 2017-11-29 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램 KR102052711B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170161838A KR102052711B1 (ko) 2017-11-29 2017-11-29 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170161838A KR102052711B1 (ko) 2017-11-29 2017-11-29 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20190063050A KR20190063050A (ko) 2019-06-07
KR102052711B1 true KR102052711B1 (ko) 2020-01-22

Family

ID=66850101

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170161838A KR102052711B1 (ko) 2017-11-29 2017-11-29 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102052711B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015004756A (ja) * 2013-06-19 2015-01-08 ヤフー株式会社 判定装置、判定方法及び判定プログラム
KR101781458B1 (ko) * 2016-04-29 2017-09-26 (주)웅진컴퍼스 언어 학습 서비스 제공 시스템 및 언어 학습 서비스 제공 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130015918A (ko) * 2011-08-05 2013-02-14 강종현 학습자 및 문장의 수준을 고려한 어학 학습 장치 및 이를 이용한 학습 제공 방법
KR20170065757A (ko) * 2015-12-04 2017-06-14 강민규 맞춤형 언어학습 제공 방법 및 이를 지원하는 장치, 서버 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015004756A (ja) * 2013-06-19 2015-01-08 ヤフー株式会社 判定装置、判定方法及び判定プログラム
KR101781458B1 (ko) * 2016-04-29 2017-09-26 (주)웅진컴퍼스 언어 학습 서비스 제공 시스템 및 언어 학습 서비스 제공 방법

Also Published As

Publication number Publication date
KR20190063050A (ko) 2019-06-07

Similar Documents

Publication Publication Date Title
KR102222317B1 (ko) 음성 인식 방법, 전자 디바이스, 및 컴퓨터 저장 매체
CN108604455B (zh) 自动确定音频流中语音字幕的定时窗口
US10332506B2 (en) Computerized system and method for formatted transcription of multimedia content
CN103956169B (zh) 一种语音输入方法、装置和***
US9886952B2 (en) Interactive system, display apparatus, and controlling method thereof
US9558741B2 (en) Systems and methods for speech recognition
KR102396983B1 (ko) 문법 교정 방법 및 장치
US20150019221A1 (en) Speech recognition system and method
US20160019671A1 (en) Identifying multimedia objects based on multimedia fingerprint
KR20160090743A (ko) 음성 신호를 기초로 한 텍스트 편집 장치 및 텍스트 편집 방법
KR102577589B1 (ko) 음성 인식 방법 및 음성 인식 장치
US10776135B2 (en) Automated setting customization using real-time user data
KR102345625B1 (ko) 자막 생성 방법 및 이를 수행하는 장치
KR20160056734A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR20220020723A (ko) 사용자의 음성 입력을 인식하는 디바이스 및 그 동작 방법
KR102193559B1 (ko) 대화형 서버 및 이의 제어 방법
US11948567B2 (en) Electronic device and control method therefor
US20170061957A1 (en) Method and apparatus for improving a language model, and speech recognition method and apparatus
JP7505001B2 (ja) デジタルコンテンツを認証するためのシステム
KR102314156B1 (ko) 미디어를 이용하는 서비스 제공 시스템, 방법 및 컴퓨터 프로그램
JP6786065B2 (ja) 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム
KR102052711B1 (ko) 미디어 관리 시스템, 미디어 관리 방법 및 컴퓨터 프로그램
US20210343175A1 (en) Systems and methods for adaptive assessment
US11562819B2 (en) Method and system for determining and improving behavioral index
JP6322125B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right