KR20210065588A - Contents registering and billing system and method for digital contents copyright protection - Google Patents

Contents registering and billing system and method for digital contents copyright protection Download PDF

Info

Publication number
KR20210065588A
KR20210065588A KR1020190154522A KR20190154522A KR20210065588A KR 20210065588 A KR20210065588 A KR 20210065588A KR 1020190154522 A KR1020190154522 A KR 1020190154522A KR 20190154522 A KR20190154522 A KR 20190154522A KR 20210065588 A KR20210065588 A KR 20210065588A
Authority
KR
South Korea
Prior art keywords
content
copyright protection
digital content
server
information
Prior art date
Application number
KR1020190154522A
Other languages
Korean (ko)
Inventor
김재석
정제화
Original Assignee
(주)아이엠비씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)아이엠비씨 filed Critical (주)아이엠비씨
Priority to KR1020190154522A priority Critical patent/KR20210065588A/en
Publication of KR20210065588A publication Critical patent/KR20210065588A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q2220/00Business processing using cryptography
    • G06Q2220/10Usage protection of distributed data files

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The present invention provides a content registration and a billing system and a method for digital content copyright protection, which includes: one or more online service provider servers which distribute digital content subject to copyright protection; and a copyright protection main server which extracts a keyword extracted from the image information text of the digital content extracted from one or more country-specific content sites and extracts a frame unit image from the digital content image and registers it as copyright information, and collects web page information distributing the digital content by calculating the similarity through deep learning of the copyright information, and charges the online service provider server which operates the web page.

Description

디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템 및 방법{CONTENTS REGISTERING AND BILLING SYSTEM AND METHOD FOR DIGITAL CONTENTS COPYRIGHT PROTECTION}Content registration and billing system and method for digital content copyright protection {CONTENTS REGISTERING AND BILLING SYSTEM AND METHOD FOR DIGITAL CONTENTS COPYRIGHT PROTECTION}

본 발명은 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템 및 방법에 관한 것이다.The present invention relates to a content registration and billing system and method for digital content copyright protection.

한류 콘텐츠의 유통과 관련된 아세안 콘텐츠 시장규모는 2014년부터 2019년까지 연평균 81%성장할 것으로 예상되며,2016년 아세안 콘텐츠 시장 규모는 전년 대비 9.03% 성장한 495억달러(약 55조원)였으며, 2021년까지는 매년 9.95%씩 성장할 것이라 전망되었다.The size of the ASEAN contents market related to the distribution of Hallyu contents is expected to grow at an average annual rate of 81% from 2014 to 2019, and the size of the ASEAN contents market in 2016 was $49.5 billion (about 55 trillion KRW), a growth of 9.03% from the previous year. It is expected to grow by 9.95%.

한류 콘텐츠 이용량 변화를 살펴보면, 1년 후 한류 콘텐츠 이용량이 현재와 비슷하거나 증가할 것이라는 응답이 모든 콘텐츠에서 40% 이상으로 나타났고, 패션/뷰티, 온라인/모바일 게임, 예능 프로그램, TV 등이 높은 비율을 보여줌. 특히, 태국, 인도네시아, 인도에서 이용량 증가비율이 높다.Looking at the change in the usage of Hallyu contents, more than 40% of all contents answered that the usage of Hallyu contents will be similar to or increase after one year, and fashion/beauty, online/mobile games, entertainment programs, TV, etc. show the ratio. In particular, the rate of increase in usage is high in Thailand, Indonesia, and India.

최근 들어, 인터넷 네트워크 환경이 비약적으로 발달함에 따라 P2P 또는 웹하드를 통해 파일의 공유가 활발하게 이루어지고 있다. 영화, 드라마와 같은 멀티미디어 콘텐츠들은 주로 웹하드, P2P 등의 인터넷 공유 사이트에서 활발히 공유 또는 유통되고 있다. 상기와 같이 공유되고 유통되고 있는 멀티미디어 파일 중 저작권이 있는 파일들 또한 불법적으로 웹상에 업로드 되어 무료로 배포되는 사례가 급증하고 있다. 모든 멀티미디어 파일의 업로드와 다운로드를 차단하는 것은 불가능하며 이러한 금지는 전체 콘텐츠 산업의 성장을 저해할 수 있다. 따라서 저작권이 보호되어야 하는 멀티미디어 파일을 보호하고 유통할 수 있는 시스템에 대한 필요성이 증가하고 있다. Recently, with the rapid development of the Internet network environment, file sharing is actively performed through P2P or web hard. Multimedia contents such as movies and dramas are actively shared or distributed mainly on Internet sharing sites such as web hard and P2P. Among the multimedia files shared and distributed as described above, the cases in which copyrighted files are also illegally uploaded to the web and distributed for free are increasing rapidly. It is impossible to block the upload and download of all multimedia files, and such a ban could hinder the growth of the entire content industry. Accordingly, there is an increasing need for a system capable of protecting and distributing multimedia files that must be protected by copyright.

방송 컨텐츠의 불법적인 유통을 차단하기 위하여 웹하드 관리자가 일일이 직접 확인을 하여 저작권을 침해하는 불법 복제물인 경우 삭제하거나, 검색 키워드를 제한하는 방식, 저작권의 보호를 받는 방송 컨텐츠의 파일명과 업로드된 불법 복제물의 파일명을 비교하는 방식, 게시된 방송 컨텐츠의 XML 상의 제목, 파일명 등을 비교하는 방식 등을 취하고 있으나, 이러한 방식들은 관리 인력이 많이 필요하게 될 뿐만 아니라, 불법 복제물을 업로드 하는 사람이 파일명이나 제목의 철자를 변형시켜 게시할 경우에는 그 효용성이 사라지게 된다. 또한, 업로드 한 후 일정 다운로드 목표량이 채워지면 삭제하고 다시 재 업로드하여 저작권 단속을 피해 가는 경우에도 그 효용성이 매우 낮다는 문제점이 있다.In order to block the illegal distribution of broadcasting contents, the web hard manager directly checks and deletes illegal copies that infringe copyrights, or restricts search keywords, the file names of broadcasting contents protected by copyright, and illegal uploaded contents Although the method of comparing the file names of duplicates and the method of comparing the titles and file names of published broadcast contents in XML, these methods not only require a lot of management personnel, but also allow the person uploading illegal copies to change the file name or name. If the spelling of the title is changed and posted, its usefulness will be lost. Also, there is a problem in that even if a certain download target amount is met after uploading, deletion and re-uploading to avoid copyright enforcement, the utility is very low.

이러한 문제점을 해소하기 위하여 사용자가 웹하드에 방송 컨텐츠를 업로드 또는 다운로드시에 웹하드에서 해당 방송 컨텐츠의 유전자 정보를 추출한 후, 필터링 서버에 기저장된 유전자 정보와 추출된 방송 컨텐츠의 유전자 정보를 비교하여, 과금을 부여하는 방송 컨텐츠 거래 시스템이 개시되었다.In order to solve this problem, when a user uploads or downloads broadcast content to the web hard, after extracting the genetic information of the corresponding broadcasting content from the web hard, the genetic information stored in the filtering server is compared with the genetic information of the extracted broadcasting content. , a broadcasting content transaction system for granting billing has been disclosed.

상기와 같은 종래의 방송 컨텐츠 거래 시스템은 웹하드 기반으로 방송 컨텐츠의 거래 관리가 이루어지게 되므로, 웹하드 관리자의 악의적인 행동에 의해 필터링을 우회하거나 매출데이터를 조작할 경우, 제휴된 방송 컨텐츠의 거래가 이루어졌음에도 불구하고, 이에 대한 거래내역이 누락됨으로써, 실질적으로 웹하드 업체는 방송 컨텐츠의 거래에 따른 이익을 챙기나, 방송사는 컨텐츠 거래내역 누락에 따른 피해를 입게 되는 문제점이 있었다.In the conventional broadcast content transaction system as described above, since the transaction management of broadcast content is made based on the web hard, the transaction of affiliated broadcast content is not possible when the web hard manager bypasses filtering or manipulates the sales data due to the malicious behavior of the web hard manager. Despite the fact that the transaction details were omitted, there was a problem that the web hard company actually took profits from the transaction of broadcasting contents, but the broadcasting company suffered damage due to the omission of the transaction details of the contents.

저작권 권리개념의 변화는 저작권기술분야에도 마찬가지로 적용되어 사전 접근통제 위주의 기술에서 이용은 허가한 후 이용실적을 추적하여 보상을 받거나 책임을 물을 수 있도록 하는 사후 추적 또는 관리기술로 바뀌어가고 있다. Changes in the concept of copyright are also applied to the field of copyright technology, and the technology is changing from prior access control-oriented technology to post-tracking or management technology that allows users to receive compensation or take responsibility by tracing usage performance after permitting use.

대한민국 공개 특허 제10-2009-0112259호Republic of Korea Patent Publication No. 10-2009-0112259 대한민국 공개 특허 제10-2001-0087808호Korean Patent Publication No. 10-2001-0087808 대한민국 공개 특허 제10-2003-0003412호Republic of Korea Patent Publication No. 10-2003-0003412 대한민국 공개 특허 제10-2010-0020658호Republic of Korea Patent Publication No. 10-2010-0020658

본 발명은 상술한 문제점을 해결하고자 안출된 것으로서, 본 발명의 목적은 글로벌 환경에서 서비스되고 있는 한류 콘텐츠의 유통 현황 정보를 한눈에 알아볼 수 있는 지능형 타겟 수집 및 분석 기술 개발 글로벌 기반 콘텐츠 유통 및 침해 현황을 모니터링하여 실질적인 과금을 가능하게 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템 및 방법을 제공하는 것이다.The present invention has been devised to solve the above problems, and the purpose of the present invention is to develop an intelligent target collection and analysis technology that can recognize the distribution status information of Hallyu content being serviced in a global environment at a glance Global-based content distribution and infringement status To provide a content registration and billing system and method for digital content copyright protection that monitors and enables actual billing.

본 발명의 일 측면에 따르면,According to one aspect of the present invention,

저작권 보호 대상 디지털 콘텐츠를 유통하는 하나 이상의 온라인 서비스 제공자 서버; 및one or more online service provider servers that distribute copyrighted digital content; and

하나 이상의 국가별 콘텐츠 사이트에서 추출된 상기 디지털 콘텐츠의 영상 정보 텍스트로부터 추출된 키워드와 상기 디지털 콘텐츠 영상으로부터 프레임 단위 이미지 추출하여 저작권 정보로 등록하고, 상기 저작권 정보의 딥러닝을 통한 유사도 계산으로 상기 디지털 콘텐츠를 유통하는 웹페이지 정보를 수집하고 상기 웹페이지를 운영하는 온라인 서비스 제공자 서버에 과금하는 저작권 보호 메인 서버; 를 포함하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템을 제공한다.The keyword extracted from the image information text of the digital content extracted from one or more country-specific content sites and the frame-by-frame image extracted from the digital content image are registered as copyright information, and the digital content is calculated by similarity calculation through deep learning of the copyright information. a copyright protection main server that collects web page information distributing content and charges an online service provider server that operates the web page; Provides a content registration and billing system for digital content copyright protection, including

상기 저작권 정보를 블록체인 네트워크에 분산하여 등록하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.Content registration and billing system for digital content copyright protection, characterized in that the copyright information is distributed and registered in a blockchain network.

상기 저작권 보호 메인 서버는, The copyright protection main server,

상기 디지털 콘텐츠의 예고편 영상으로부터 프레임 단위 이미지 추출하여 콘텐츠 별 딥러닝을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.Content registration and billing system for digital content copyright protection, characterized in that by extracting frame-by-frame images from the trailer image of the digital content and performing deep learning for each content.

상기 저작권 보호 메인 서버는 하나 이상의 상기 온라인 서비스 제공 서버 중 접속 차단 및 장애 발생 시 HTML 및 로그 분석을 통해 접속 오류 및 접속 제한을 검출하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.The copyright protection main server is a content registration and billing system for digital content copyright protection, characterized in that it detects access errors and access restrictions through HTML and log analysis when an access block or failure occurs among one or more of the online service providing servers.

상기 저작권 보호 메인 서버는 접속 장애 원인을 분석하고, 상기 장애 원인에 따른 이벤트 처리 및 수집 재수행을 처리하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.The copyright protection main server analyzes the cause of the access failure, and the content registration and billing system for digital content copyright protection, characterized in that it processes event processing and collection re-performation according to the failure cause.

상기 저작권 보호 메인 서버는 레플리카 서버를 추가로 포함하고,The copyright protection main server further includes a replica server,

접속 장애 발생 시 상기 레플리카 서버가 상기 디지털 콘텐츠 유통 페이지 수집 역할을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.Content registration and billing system for digital content copyright protection, characterized in that the replica server serves to collect the digital content distribution page when an access failure occurs.

상기 저작권 보호 메인 서버는 The copyright protection main server is

상기 디지털 콘텐츠를 유통하는 웹페이지의 페이지뷰, 로그인 정보를 통해 상기 디지털 콘텐츠 사용료를 과금하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.A content registration and billing system for digital content copyright protection that charges the digital content usage fee through page views and login information of a web page that distributes the digital content.

상기 저작권 보호 메인 서버는,The copyright protection main server,

상기 디지털 콘텐츠의 주요 정보에서 복수개의 키워드를 추출하고, extracting a plurality of keywords from the main information of the digital content,

상기 복수개의 키워드는 해당 국가 언어 포탈에 업로드된 상기 디지털 콘텐츠의 요약 정보 또는 소개 자료에서 추출하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.The plurality of keywords is a content registration and billing system for digital content copyright protection, characterized in that it is extracted from summary information or introduction material of the digital content uploaded to the corresponding national language portal.

상기 레플리카 서버는 상기 저작권 보호 메인 서버와 IP가 다른 서버로 접속 차단 감지 시 상기 저작권 보호 메인 서버의 상기 수집 동작은 중단하고 상기 레플리카 서버가 상기 수집 동작을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.The replica server stops the collection operation of the copyright protection main server and the replica server performs the collection operation when it detects that access to a server having a different IP from the copyright protection main server is detected. content registration and billing system for

상기 저작권 보호 메인 서버는 The copyright protection main server is

상기 디지털 콘텐츠를 유통하는 웹페이지 정보에서 지리적 정보를 추출하여 국가별 디지털 콘텐츠 소비 통계를 제공하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.Content registration and billing system for digital content copyright protection, characterized in that by extracting geographic information from web page information distributing the digital content, and providing digital content consumption statistics by country.

본 발명에 따르면, 단순한 용어번역의 수준을 넘어서 개체인식 및 개체간 관계 인식이 가능한 저작권 콘텐츠 지식베이스(프로그램, 배우, 제작자 등)를 기반으로 한 자연어 처리기술(동명이인, 오탈자, 축약어, 별명, 예명, 신조어 등의 처리 지원)을 통해, 해당 콘텐츠의 해외 시장에서의 유통 시 타겟 컨텐츠 식별을 가능하게 한다.According to the present invention, natural language processing technology (with the same name, misspellings, abbreviations, nicknames) based on the copyright content knowledge base (programs, actors, producers, etc.) , stage name, neologism, etc.) to enable target content identification when distributing the corresponding content in overseas markets.

모니터링 대상 콘텐츠 수집을 위한 딥러닝 기술로서 영상 이미지 + 게시물 텍스트 데이터 활용, 영상과 텍스트의 상관관계가 융합된 지식베이스 활용, 정보 누락 등 불확실한 환경에서도 유연한 대응이 가능해지고, 저작권 콘텐츠를 선정하여 모니터링 하되, 사이트를 한정하지 않는 방식으로 진행. 기존 대비 대상 저작권 콘텐츠의 위반 여부 및 유통 현황 파악에 유리 하다.As a deep learning technology for collecting content to be monitored, it enables flexible responses in uncertain environments such as video image + post text data use, a knowledge base that combines video and text correlation, and omission of information, and selects and monitors copyrighted content. , proceeding in a non-site manner. Compared to the existing ones, it is advantageous to check whether the target copyright content has been violated and the current distribution status.

불법 사이트 IP 추적 및 IP를 기반 지리위치정보(Geolocation) 활용으로 서버위치 추적 지리위치정보 활용으로, 국가별 불법 유통 현황 및 통계 정보 제공를 제공할 수 있다.By tracking illegal site IP and using IP-based geolocation information to track server location, it is possible to provide illegal distribution status and statistical information for each country by using geolocation information.

도 1 은 본 발명의 일 실시예에 따른 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템의 구성을 나타낸 도면이다.
도 2 는 도 1의 저작권 보호 메인 서버의 구성을 나타낸 도면이다.
도 3 은 본 발명의 실시예에 따른 저작권 보호 메인 서버에 의한 수집 정확도를 나타낸 도면이다.
1 is a diagram showing the configuration of a content registration and billing system for digital content copyright protection according to an embodiment of the present invention.
FIG. 2 is a diagram showing the configuration of the copyright protection main server of FIG. 1 .
3 is a view showing the collection accuracy by the copyright protection main server according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.Since the present invention can have various changes and can have various embodiments, specific embodiments are illustrated in the drawings and will be described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and it should be understood to include all modifications, equivalents and substitutes included in the spirit and scope of the present invention. In describing the present invention, if it is determined that a detailed description of a related known technology may obscure the gist of the present invention, the detailed description thereof will be omitted.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first, second, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, a first component may be referred to as a second component, and similarly, a second component may also be referred to as a first component. and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.

본 명세서에서 어떤 구성요소로부터 다른 구성요소로 "입력된다" 거나 "전달된다" 등으로 언급된 때에는, 그 다른 구성요소에 직접 입력되거나 또는 직접 전달될 수도 있지만, 중간에 다른 구성요소를 거쳐 입력되거나 또는 전달될 수도 있다고 이해되어야 할 것이다. 반면에 어떤 구성요소로부터 다른 구성요소에 "직접 입력된다" 거나 "직접 전달된다" 라고 언급된 때에는, 중간에 다른 구성요소를 거치지 않는 것으로 이본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.When it is referred to as "input" or "transferred" from one component to another component in the present specification, it may be directly input or directly transmitted to the other component, but may be input through another component in the middle or Or it will be understood that it may be transmitted. On the other hand, when it is referred to as "directly input" or "directly transmitted" from one component to another component, the term used in this application as not passing through another component in the middle is used only to describe a specific embodiment. It is not intended to limit the present invention. The singular expression includes the plural expression unless the context clearly dictates otherwise. In the present application, terms such as “comprise” or “have” are intended to designate that a feature, number, step, operation, component, part, or combination thereof described in the specification exists, but one or more other features It should be understood that this does not preclude the existence or addition of numbers, steps, operations, components, parts, or combinations thereof.

본 명세서의 전반에 걸쳐 기재된 "부(Unit)", "단말(Terminal)", "서버(Server)" 및 "시스템(System)" 등의 용어는 하나 또는 둘 이상의 기능이 조합된 동작을 처리하는 단위를 의미하며, 이는 하드웨어, 소프트웨어 또는, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Terms such as "Unit", "Terminal", "Server", and "System" described throughout this specification are used to process an operation in which one or two or more functions are combined. It means a unit, which may be implemented as hardware, software, or a combination of hardware and software.

본 명세서에 설명된 다양한 기법은 하드웨어 또는 소프트웨어와 함께 구현될 수 있거나, 적합한 경우에 이들 모두의 조합과 함께 구현될 수 있다. 본 명세서에 사용된 바와 같은 "부", "단말", "서버" 및 "시스템" 등의 용어는 마찬가지로 컴퓨터 관련 엔티티(Entity), 즉 하드웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어 또는 실행 시의 소프트웨어와 등가로 취급할 수 있다.The various techniques described herein may be implemented in conjunction with hardware or software, or a combination of both, where appropriate. As used herein, terms such as "unit," "terminal," "server," and "system," likewise refer to computer-related entities, i.e. hardware, a combination of hardware and software, software or software in execution. can be treated as equivalent.

또한, 본 발명에서 사용자 단말 및 서버에서 실행되는 프로그램은 "부" 단위로 구성될 수 있고, 읽기, 쓰기 및 지우기가 가능한 형태로 하나의 물리적 메모리에 기록되거나, 둘 이상의 메모리 또는 기록매체 사이에 분산되어 기록될 수 있다.In addition, in the present invention, the programs executed in the user terminal and the server may be configured in "unit" units, and are recorded in one physical memory in a form capable of reading, writing and erasing, or distributed between two or more memories or recording media. and can be recorded.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related art, and should not be interpreted in an ideal or excessively formal meaning unless explicitly defined in the present application. does not

이하, 도면을 참조하여 본 발명의 실시예에 따른 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템 및 방법을 설명하기로 한다.Hereinafter, a content registration and billing system and method for digital content copyright protection according to an embodiment of the present invention will be described with reference to the drawings.

도 1은 콘텐츠 거래에 관계되는 구성요소를 나타낸다. 도시되는 바와 같이, 콘텐츠를 생산하는 콘텐츠 제공자 서버(1500), 콘텐츠 판매자 및 유통자인 온라인 서비스 제공자 서버(1400), 콘텐츠를 업로드 또는 다운로드하여 콘텐츠를 소비하는 사용자 단말기(1100), 콘텐츠의 저작권 보호를 위한 저작권 보호 메인서버(1200), 온라인 서비스 제공자(OSP)에서 이루어지는 콘텐츠를 감시하는 필터링 서버(1600), 콘텐츠의 저작권 정보 및 사용 내역을 분산하여 등록하는 노드들로 이루어진 블록체인 네트워크(1700)를 포함한다.1 shows the components involved in content transaction. As shown, a content provider server 1500 that produces content, an online service provider server 1400 that is a content seller and distributor, a user terminal 1100 that uploads or downloads content and consumes content, protects the copyright of the content. For the copyright protection main server 1200, the filtering server 1600 for monitoring the content made by the online service provider (OSP), and a blockchain network 1700 consisting of nodes that distribute and register the copyright information and usage history of the content. include

콘텐츠 제공자 서버(1500)는 콘텐츠를 소유, 판매할 수 있는 라이센스를 보유한 사업자인 콘텐츠 제공자(CP; CONTENTS PROVIDER)의 서버를 말한다. iMBC와 같은 방송사 서버가 될 수 있다. 콘텐츠 제공자 서버(1500)는 이하에서 CP 서버(1500)라 한다. The content provider server 1500 refers to a server of a content provider (CP; CONTENTS PROVIDER), which is a business owner having a license to own and sell content. It can be a broadcaster server such as iMBC. The content provider server 1500 is hereinafter referred to as a CP server 1500 .

온라인 서비스 제공자 서버(1400)는 콘텐츠 판매자 또는 유통자인 온라인 서비스 제공자(OSP; ONLINE SERVICE PROVIDER)의 서버로, 웹하드, P2P 업체의 서버를 말한다. 스트리밍 서버를 포함한다. 이하에서, 온라인 서비스 제공자 서버(1400)는 OSP 서버(1400)라 한다. OSP 서버(1400)는 다수의 사용자가 콘텐츠를 공유할 수 있도록 저장 공간을 제공하며, 사용자 단말기에서 콘텐츠의 업로드 또는 다운로드가 가능하도록 사용자 단말기(1100)에 업다운 프로그램을 제공한다.The online service provider server 1400 is a server of an online service provider (OSP) that is a content seller or distributor, and refers to a server of a web hard or P2P company. Includes streaming server. Hereinafter, the online service provider server 1400 is referred to as an OSP server 1400 . The OSP server 1400 provides a storage space so that a plurality of users can share content, and provides an up-down program to the user terminal 1100 so that content can be uploaded or downloaded from the user terminal.

필터링 서버(1600)는 저작권법의 OSP의 면책과 관련된 기술적 조치를 취하기 위하여 필터링 기능을 수행한다. 필터링(Filtering)은 어떠한 적합한 기준에 따라 각 입력이나 출력 요청을 시험하고 그것을 적절히 처리한 다음 이를 다음 단계로 전달하기 위한 목적으로 설계된 프로그램으로, 입력된 데이터를 받아서 그것에 관하여 적절한 판단을 하고, 필요하다면 변환을 해서 다른 프로그램에 넘기는 일종의‘관문’과 같은 코드이다.(윤종수,"온라인서비스제공자의 책임제한과 특수한 유형의 온라인 서비스제공자의 기술조치의무", 인권과 정의, 제395호(2009.7), 36면.) 필터링의 핵심은 해당 파일이 저작권 침해물인지 판단하는 것이다. 필터링 기술은 검색어 기반 필터링(제목 필터링, 문자열 비교방식, 특정 유형의 파일 필터링), 해시기반 필터링(해시값 비교를 통한 필터링), 특징 기반 필터링(오디오/비디오 인식기술을 활용한 필터링)으로 구별된다. '제목 필터링' 금칙어 설정을 통한 검색 제한 조치로 비용이 소요되지 않으며 대부분의 P2P, 웹하드 업체에서 적용하고 있는 방식으로서 음악·영화 등 저작물 종류에 관계없이 쉽게 적용 가능하나, 파일의 제목을 조금 변경하는 방법으로 쉽게 필터링을 피해갈 수 있다는 단점이 있다. '문자열 비교방식'은 제목 필터링과 유사한 방식으로서 제목을 이루는 단어의 조합 등 경우의 수를 미리 산정하여 제목 필터링을 피하는 경우를 차단하는 방법이다. 별다른 비용이 소요되지 않으며, 일부 업체에서 적용하고 있으나 차단의 수준이 완벽하지는 못하다는 단점이 있다. '특정유형의 파일 필터링'은 제목 필터링과 유사한 방식으로 파일의 확장자명(음악의 경우 mp3 또는 ogg파일, 영화의 경우 divix파일 등)을 차단하는 방법으로서 별다른 비용이 소요되지 않으나, 저작물 또는 저작권자 별로 개별적인 적용이 용의하지 않으며 파일의 확장자명을 변경할 경우 쉽게 필터링을 피해갈 수 있는 단점이 있다. '해시기반 필터링'은 파일마다 고유한 해시값이 존재하므로 해시함수를 이용하여 저작물을 인식·차단하는 방법으로 일부 업체에서 적용하고 있는 방식으로서 전문적인 기술 없이도 개별 P2P업체 등에서 쉽게 적용이 가능하나, 동일한 저작물이라도 파일이 다를 경우 해시값이 달라지므로 필터링을 피할 수 있다는 단점이 있다. '특징 기반 필터링'은 음악, 영화의 원본파일이 가지고 있는 고유한 특성(음원DNA, 영상물DNA라고 함)을 이용하여 저작물을 인식·차단하는 첨단기법으로서 해시값에 의한 특징비교와는 달리 파일이 복제되더라도 쉽게 변하지 않으므로 거의 완벽하게 필터링되는 것으로 알려져 있다. 음악의 경우 오디오 인식기술을 활용하여 일부 P2P업체에 적용하고 있고, 영상물의 경우도 오디오 인식기술만으로도 필터링이 가능콘텐츠 이용횟수 및 관련 매출액을 OSP 별로 정확히 파악하여야 정확한 콘텐츠 사용료를 산정할 수 있다(문일환,온라인서비스제공자(OSP)의 법적 의무와 책임,지식재산연구 제7권 제2호(2012. 6)). The filtering server 1600 performs a filtering function in order to take technical measures related to the OSP's immunity of copyright law. Filtering is a program designed for the purpose of testing each input or output request according to some suitable criteria, processing it appropriately, and then passing it to the next step. It is a kind of 'gateway' code that is converted and passed to other programs. (Jongsu Yoon, "Limitation of Liability of Online Service Providers and Obligation of Special Types of Online Service Providers to Take Technical Measures", Human Rights and Justice, No. 395 (July 2009), page 36.) The key to filtering is to determine whether the file is a copyright infringement. Filtering technology is divided into search word-based filtering (title filtering, string comparison method, specific type of file filtering), hash-based filtering (filtering through hash value comparison), and feature-based filtering (filtering using audio/video recognition technology) . 'Title filtering' is a method that does not cost any search restrictions through the setting of forbidden words, and is applied by most P2P and web hard companies. It can be easily applied regardless of the type of work, such as music or movies, but the file title is slightly changed This method has the disadvantage of being able to easily avoid filtering. The 'character string comparison method' is a method similar to title filtering, in which the number of cases such as combinations of words constituting a title is calculated in advance to prevent cases of avoiding title filtering. It does not cost much and is applied by some companies, but there is a disadvantage that the level of blocking is not perfect. 'Filtering specific types of files' is a method similar to title filtering, which blocks file extensions (mp3 or ogg files in the case of music, divix files in the case of movies). It is not convenient to apply individually, and there is a disadvantage that filtering can be easily avoided if you change the file extension name. 'Hash-based filtering' is a method used by some companies to recognize and block copyrighted works using a hash function because each file has a unique hash value. If the files are different even for the same work, the hash value is different, so filtering can be avoided. 'Feature-based filtering' is a cutting-edge technique that recognizes and blocks copyrighted works by using the unique characteristics of original music and movie files (referred to as sound source DNA and video material DNA). It is known to be almost completely filtered because it does not change easily even if it is duplicated. In the case of music, audio recognition technology is used and applied to some P2P companies, and in the case of video, filtering is possible only with audio recognition technology. In order to accurately calculate the content usage fee, the number of times of content use and related sales must be accurately identified for each OSP (Il-Hwan Moon) , Legal Obligations and Responsibilities of Online Service Providers (OSPs), Intellectual Property Research Vol. 7 No. 2 (2012. 6)).

상기와 같은 필터링 서버(1600)와 OSP 서버(1400)의 운영 주체 간의 담합으로 인하여 정확한 필터링이 이뤄지지 않는 문제점이 있었고, CP가 자체적으로 콘텐츠 거래 현황을 감시할 필요가 있어 본 발명의 저작권 보호 시스템은 콘텐츠의 저작권 정보를 분산 등록하는 블록체인 네트워크(1700)와 저작권 보호 메인 서버(1200) 및 사용자 단말기(1100)에서 작동하는 저작권 보호 모듈(1120)을 추가로 포함할 수 있다.Due to the collusion between the operating entities of the filtering server 1600 and the OSP server 1400 as described above, there is a problem that accurate filtering is not performed, and the CP needs to monitor the content transaction status by itself, so the copyright protection system of the present invention is It may further include a block chain network 1700 for distributed registration of copyright information of content, and a copyright protection module 1120 operating in the copyright protection main server 1200 and the user terminal 1100 .

저작권 보호 메인서버(1200)는 CP가 제작한 디지털 콘텐츠의 업로드 다운로드 거래 현황을 감시하고 통계 관리하는 기능을 한다. 저작권 보호 메인서버(1200)는 도 2에 도시되는 바와 같이, 모니터링부(1210), 콘텐츠 인식부(1220), 콘텐츠 DNA/RMI 관리부(1230), 통계관리부(1240), 실시간 DNA 생성부(1250), 다국어 처리부(1260), 타겟 수집부(1270) 및 접속 제한 회피부(1280)를 포함한다. 실시간 DNA 생성부(1250)는 도 1에 도시되는 바와 같이 별도의 DNA 생성 서버(1300)로 분리되어 구성될 수 있다.The copyright protection main server 1200 functions to monitor the upload and download transaction status of digital content produced by the CP and manage statistics. As shown in FIG. 2 , the copyright protection main server 1200 includes a monitoring unit 1210 , a content recognition unit 1220 , a content DNA/RMI management unit 1230 , a statistics management unit 1240 , and a real-time DNA generation unit 1250 . ), a multilingual processing unit 1260 , a target collection unit 1270 , and an access restriction avoiding unit 1280 . The real-time DNA generation unit 1250 may be configured as a separate DNA generation server 1300 as shown in FIG. 1 .

모니터링부(1210)는 자동 업데이트 모듈과 OSP 클라이언트 감시 서버를 포함하여 OSP를 감시하고 모니터링 기능을 수행한다. 유전자 정보가 결합된 멀티미디어 파일-수신하면 유전자 정보 추출하고 추출된 유전자 정보와 기 저장된 유전자 정보를 비교하여 유사 유전자 정보가 존재하는 경우 결과 출력한다. 콘텐츠 인식부(1220)는 콘텐츠 HASH 검색 서버, AUDIO DNA 검색 서버, VIDEO DNA 검색 서버를 포함하여, 콘텐츠 파일에서 Hash 검색 및 DNA 검색 요청 기능을 수행한다. DNA 저장 및 검색 기능을 수행한다. 콘텐츠 DNA/RMI 관리부(1230)는 콘텐츠 인식부(1220)의 HASH와 A/V DNA 검색을 위한 RMI DB, HASH DB, DNA DB를 포함하고 RMI, Hash, 생성된 A/V DNA를 관리하고, OSP 계약 데이터(차단, 유통, 가격, 제목, 등)을 저장하고 검색 결과에 따라 자동 매칭한다. 통계관리부(1240)는 사용자 단말기(1100)의 저작권 보호 모듈(1120)을 통해 수집된 실거래 내역 정보를 기반으로 필터링 서버(1600)의 필터링 내역과 비교, 제휴 유무, 제휴 설정 시각, 판매 내역, 정산 누락 현황 등의 실시간 현황 및 통계를 제공한다. LOG 암호화 DB 서버를 포함하여 암복호화 내역 저장 및 통계 관리한다. 실시간 DNA 생성부(1250)는 실시간 방송 콘텐츠에 대한 오디오 비디오 DNA를 동시에 생성하여 콘텐츠 인식 시스템에 실시간 송신 및 자동 등록하는 시스템이다. 전송 데이터 및 거래 내역 등은 암호화 처리된다. 암호화 기술에 대한 상세한 설명은 생략하기로 한다.The monitoring unit 1210 monitors the OSP, including the automatic update module and the OSP client monitoring server, and performs a monitoring function. Multimedia file combined with genetic information - When received, the genetic information is extracted, and the extracted genetic information is compared with the previously stored genetic information, and if similar genetic information exists, the result is output. The content recognition unit 1220 includes a content HASH search server, an AUDIO DNA search server, and a VIDEO DNA search server, and performs hash search and DNA search request functions in the content file. It performs DNA storage and retrieval functions. The content DNA/RMI management unit 1230 includes RMI DB, HASH DB, and DNA DB for HASH of the content recognition unit 1220 and A/V DNA search, and manages RMI, Hash, and generated A/V DNA, Stores OSP contract data (block, distribution, price, title, etc.) and automatically matches according to search results. The statistics management unit 1240 compares with the filtering history of the filtering server 1600 based on the actual transaction history information collected through the copyright protection module 1120 of the user terminal 1100, whether there is a partnership, a partnership setting time, sales history, settlement It provides real-time status and statistics such as omission status. LOG Encryption/decryption history storage and statistics management including DB server. The real-time DNA generator 1250 is a system for simultaneously generating audio video DNA for real-time broadcast content, transmitting and automatically registering the audio video DNA in a content recognition system in real time. Transmitted data and transaction details are encrypted. A detailed description of the encryption technology will be omitted.

한편, 본 발명의 실시예에 따른 저작권 보호 메인 서버(1200)의 모니터링부(1210)는 저작권 보호 대상 디지털 콘텐츠의 판매, 스트리밍을 위한 게시 페이지를 수집하여 저작권 침해 OSP와 해당 OSP에 대한 과금을 실시한다. On the other hand, the monitoring unit 1210 of the copyright protection main server 1200 according to an embodiment of the present invention collects posting pages for the sale and streaming of digital contents subject to copyright protection, and charges the copyright infringement OSP and the OSP. do.

즉, 본 발명의 실시예에 따른 저작권 보호 메인 서버(1200)는 다국어 처리부(1260), 타겟 수집부(1270), 접속 제한 회피부(1280)를 추가로 포함하여 저작권 보호 대상 디지털 콘텐츠(이하 타겟 콘텐츠라 칭함)를 판매 및 스트리밍 하기 위한 게시 페이지 정보를 수집한다.That is, the copyright protection main server 1200 according to the embodiment of the present invention additionally includes a multilingual processing unit 1260 , a target collection unit 1270 , and an access restriction avoiding unit 1280 , so that digital contents subject to copyright protection (hereinafter, the target We collect information on posting pages for selling and streaming content).

번역기를 통하여 타겟 콘텐츠의 키워드를 다국어로 변환할 경우 해당 국가에서 실제 유통되는 콘텐츠 명과 90%이상 불일치한다. 따라서, 본 발명의 실시예에 따른 저작권 보호 메인서버(1200)는 다국어처리부(1260)를 포함하여 해외 사이트를 통한 콘텐츠 유통을 모니터링 할 수 있도록 한다. 다국어처리부(1260)는 다국어 변환부와 다국어 키워드 추출부를 포함한다. 다국어 변환부는 다국어 번역기를 활용하여 타겟 콘텐츠에 대한 요약, 설명으로부터 추출한 키워드를 수집하고자 하는 국가의 언어로 변환한다. 다국어 키워드 추출부는 해당 국가의 메인 포탈의 뉴스, SNS, 블로그 등으로부터 타겟 콘텐츠에 관한 텍스트로부터 다국어 키워드를 추출한다.When the keyword of the target content is converted into multiple languages through a translator, the name of the content actually circulated in the relevant country is inconsistent by more than 90%. Accordingly, the copyright protection main server 1200 according to the embodiment of the present invention includes the multilingual processing unit 1260 to monitor content distribution through overseas sites. The multilingual processing unit 1260 includes a multilingual conversion unit and a multilingual keyword extraction unit. The multilingual conversion unit converts the keywords extracted from the summary and description of the target content into the language of the country you want to collect by using a multilingual translator. The multilingual keyword extraction unit extracts multilingual keywords from texts related to target content from news, SNS, blogs, etc. of the main portal of the country.

타겟 수집부(1270)는 키워드 추출부와 이미지 딥런닝부를 포함한다. 키워드 추출부는 다국어 번역기를 활용하여 키워드를 다국어로 변환 및 추출하나 번역기를 활용할 경우 콘텐츠 명과 90% 이상 불일치하므로 해당 국가의 주요 유통 사이트의 웹 데이터 수집 분석을 통해 키워드를 추출 변환한다. 즉 해당 국가의 블로그, 뉴스, sns 등의 비정형 데이터 수집 및 분석을 통해 별칭 축약어 등을 포함하는 키워드를 추출한다. 전문가를 통한 영어와 해당국 언어 변환을 검증할 수 있다. 변환된 콘텐츠 명을 타겟 콘텐츠로 활용하기 위한 데이터 셋을 구축한다. 타겟 수집부(1270)는 키워드 추출부에서 추출된 키워드를 기반으로 유사도를 TF-IDF 가중치 또는 키워드 간 상관관계를 통해 계산하여 타겟 콘텐츠의 영상 정보 텍스트(요약 정보 소개자료 등)로부터 유사도를 계산한다. 타겟 콘텐츠의 예고편 영상으로부터 프레임 단위 이미지 추출하여 콘텐츠별 이미지 딥러닝을 수행한다. 텍스트 및 콘텐츠 영상에서 추출된 이미지를 활용하여 이미지 기반 딥러닝,CNN, RNN 등으로 유사도를 계산하는 것이다. 텍스트 및 이미지 융합의 지식 베이스 구축을 통해 가중치 통합 가중치 보정 등을 통한 통합 유사도를 계산 및 분석하여 타겟 콘텐츠를 판매 또는 스트리밍 하기 위하여 게시한 웹페이지를 수집한다. 타겟 콘텐츠를 판매 또는 스트리밍 하기 위하여 게시한 웹페이지 수집은 모니터링부(1210)가 수행할 수 있다.The target collection unit 1270 includes a keyword extraction unit and an image deep learning unit. The keyword extraction unit converts and extracts keywords into multiple languages by using a multilingual translator, but when using a translator, the content name does not match more than 90%, so the keyword is extracted and converted through web data collection and analysis of major distribution sites in the country. That is, keywords including alias abbreviations, etc. are extracted through collection and analysis of unstructured data such as blogs, news, and sns in the relevant country. You can verify the conversion between English and the language of your country through an expert. Build a data set to use the converted content name as the target content. The target collection unit 1270 calculates the similarity from the image information text (summary information introduction material, etc.) of the target content by calculating the similarity through the TF-IDF weight or the correlation between the keywords based on the keyword extracted by the keyword extraction unit. . Image deep learning for each content is performed by extracting frame-by-frame images from the trailer image of the target content. The similarity is calculated using image-based deep learning, CNN, and RNN using images extracted from text and content images. Through the establishment of a knowledge base of text and image convergence, the web pages posted to sell or stream target content are collected by calculating and analyzing the integrated similarity through weight integration weight correction, etc. The monitoring unit 1210 may perform the collection of web pages posted to sell or stream target content.

접속 제한 회피부(1280)는 트래픽 감지 회피 I/ID를 수집한다. 접속 제한 회피부(1280)는 접속 제한 검출부, 장애 원인 분석부, 수집 재수행부를 포함한다. 접속 제한 검출부는 OSP 서버와 같은 콘텐츠 유통 사이트들 중 접속 차단 및 장애 발생 시 HTML 및 로그 분석을 수행하여 접속 오류 및 접속 제한을 검출한다. 장애 원인 분석부는 접속 차단 패턴을 분석한다. 즉, IP 차단, 오류 팝업창, 로그인 ID 차단 등과 같은 장애 원인을 분석하고, 수집 재수행부는 장애 원인에 따른 이벤트 처리 및 병렬 처리 및 우회 기술을 활용한 수집을 재수행한다. 또한, 레플리카 서버를 도입하여 장애 감지 시 레플리카 서버와 타겟 수집 역할을 스위칭한다. The access restriction avoiding unit 1280 collects traffic detection avoidance I/IDs. The access restriction avoiding unit 1280 includes an access restriction detecting unit, a failure cause analysis unit, and a collection re-performing unit. The access restriction detection unit detects access errors and access restrictions by analyzing HTML and logs when access is blocked or an error occurs among content distribution sites such as OSP servers. The failure cause analysis unit analyzes the access blocking pattern. In other words, it analyzes the causes of failure such as IP blocking, error pop-up window, login ID block, etc., and the collection re-performing unit performs event processing according to the failure cause and collection using parallel processing and bypass technology. In addition, by introducing a replica server, the role of replica server and target collection is switched when failure is detected.

현재의 콘텐츠 식별 방법은 영상의 메타 정보를 통한 확인이나 핑거 프린팅 기술을 이용하여 영상 자체를 분석하는 방법을 사용하여야 해서 식별 대상이 되는 영상의 정확한 데이터가 있어야 가능한데, 상기와 같이 구성된 다국어 처리부(1260), 타겟 수집부(1270)와 접속 제한 회피부(1280)를 구비하여 콘텐츠 자체정보가 아닌 콘텐츠를 서비스하기 위한 게시물의 정보를 통해 식별이 가능하도록 하여 보다 빠르게 유사도를 판단이 가능하며 유사도의 보정을 위해 게시물에 사용되는 텍스트와 이미지 정보를 모두 활용하여 판단할 수 있게 된다. 즉, 본 발명의 실시예에 따른 저작권 보호 메인 서버(1200)는 타겟이 되는 콘텐츠의 주요 정보에서 키워드를 추출하고, 동영상의 이미지 추출과 이미지 딥러닝을 통해, 저작권 보호 콘텐츠의 다운로드 또는 스트리밍을 위한 웹페이지를 검출해 낸다. 통계관리부(1240)는 해당 웹페이지의 페이지뷰, 다운로드 등을 검출하여 디지털 컨텐츠 사용량을 산출하고 사용료를 과금하거나, 해당 웹페이지의 OSP의 거래 내역을 검토할 수 있게 한다.The current content identification method requires accurate data of the image to be identified because verification through meta information of the image or a method of analyzing the image itself using fingerprinting technology must be used. The multilingual processing unit 1260 configured as described above ), the target collection unit 1270 and the access restriction avoidance unit 1280 are provided so that identification is possible through the information of the posting for servicing the content, not the content itself information, so that the similarity can be determined more quickly and the similarity is corrected For this purpose, it is possible to make a judgment by using both text and image information used in the post. That is, the copyright protection main server 1200 according to the embodiment of the present invention extracts keywords from the main information of the target content, and through image extraction and image deep learning of video, for downloading or streaming copyright protection content. Detect web pages. The statistics management unit 1240 detects page views, downloads, etc. of the corresponding web page to calculate the digital content usage and charge a usage fee, or to review the transaction details of the OSP of the corresponding web page.

사용자 단말기(1100)는 콘텐츠를 업로드 또는 다운로드하는 단말기로, PC, 스마트폰 등이 될 수 있다. 사용자 단말기(1100)는 OSP 서버(1400)를 이용하기 위하여 접속 시 콘텐츠 업다운을 위한 OSP 클라이언트 프로그램과 저작권 보호 시스템의 stand alone program이 다운되어 실행된다. 저작권 보호 시스템의 stand alone program은 OSP 클라이언트 프로그램에 모듈 형태로 삽입되는 것이 바람직하다. OSP 클라이언트 프로그램에 의해 OSP 클라이언트 모듈(1110)이 생성되고, 저작권 보호 시스템 스탠드 얼론 프로그램에 의해 저작권 보호 모듈(1120)이 생성된다. The user terminal 1100 is a terminal for uploading or downloading content, and may be a PC, a smartphone, or the like. When the user terminal 1100 is connected to use the OSP server 1400, the OSP client program for content up-down and the stand-alone program of the copyright protection system are down and executed. It is desirable that the stand alone program of the copyright protection system be inserted into the OSP client program in the form of a module. The OSP client module 1110 is generated by the OSP client program, and the copyright protection module 1120 is generated by the copyright protection system standalone program.

OSP 클라이언트 모듈(1110)은 사용자가 OSP를 통해 파일 업/다운로드 시 사용자 단말기(1100) 환경 내에서 1차적으로 기본적인 필터링과 판매 프로세스의 유효성을 검증(암복호화)한다. The OSP client module 1110 primarily verifies (encrypts and decrypts) the validity of basic filtering and sales processes within the environment of the user terminal 1100 when a user uploads/downloads a file through the OSP.

저작권 보호 모듈(1120)은 OSP 클라이언트 모듈(1110)과 독자적으로 작동하여 OSP에 필터링 값을 전달함과 동시에 실제 콘텐츠 거래 내역 모니터링 및 자동 정산 시스템으로 기존 필터링과 관제 시스템의 기능을 동시에 진행하게 된다. 저작권 보호 모듈(1120)은 OSP 클라이언트 모듈(1110)이 콘텐츠의 업/다운을 실행하면, 해당 콘텐츠가 압축파일인지 판단하고, 압축파일일 경우 해당 파일의 설정 크기만 압출풀기를 수행한다. 그 후 해당 파일의 크기, 동영상 파일인지 여부, 파일 타이틀을 체크하여 해당 파일이 설정 크기 이상일 경우, 동영상 파일인지를 판단하고, 설정크기 이상의 동영상 파일 일 경우, 파일 타이틀을 체크하여 저작권 보호 대상 콘텐츠 인지를 판단하고, HASH를 추출하여 저작권 보호 대상 콘텐츠 인지를 판단하고, 타이틀 키워드와 HASH로 저작권 보호 대상 콘텐츠 인지 여부가 판단되지 않은 파일의 DNA를 추출하여 콘텐츠 인식부(1220)의 DNA 서버에서 검색하여 저작권 보호 콘텐츠 인지를 판단한다. DNA는 AUDIO DNA인 것이 바람직하다. 저작권 보호 콘텐츠로 판단될 경우, 통계 관리부(1240)의를 거래 내역 DB에 저장하여 OSP와 독자적으로 저작권 거래 내역을 구성할 수 있게 된다. The copyright protection module 1120 operates independently with the OSP client module 1110 to deliver a filtering value to the OSP and simultaneously performs the functions of the existing filtering and control system as an actual content transaction history monitoring and automatic settlement system. The copyright protection module 1120 determines whether the corresponding content is a compressed file when the OSP client module 1110 uploads or downloads the content, and if it is a compressed file, extracts only the set size of the corresponding file. After that, it checks the size of the file, whether it is a video file, and the file title. If the file is larger than the set size, it is determined whether it is a video file. If it is a video file larger than the set size, the file title is checked to determine whether the content is subject to copyright protection. , extract the HASH to determine whether the content is subject to copyright protection, extract the DNA of the file for which it is not determined whether the content is subject to copyright protection with the title keyword and HASH, and retrieve it from the DNA server of the content recognition unit 1220 Whether the content is copyright protected or not. The DNA is preferably AUDIO DNA. If it is determined that the content is copyright protected, the statistics management unit 1240 is stored in the transaction history DB, so that it is possible to configure the copyright transaction details independently with the OSP.

본 발명에 따르면, 단순한 용어번역의 수준을 넘어서 개체인식 및 개체간 관계 인식이 가능한 저작권 콘텐츠 지식베이스(프로그램, 배우, 제작자 등)를 기반으로 한 자연어 처리기술(동명이인, 오탈자, 축약어, 별명, 예명, 신조어 등의 처리 지원)을 통해, 해당 콘텐츠의 해외 시장에서의 유통 시 타겟 컨텐츠 식별을 가능하게 한다.According to the present invention, natural language processing technology (with the same name, misspellings, abbreviations, nicknames) based on the copyright content knowledge base (programs, actors, producers, etc.) , stage name, neologism, etc.) to enable target content identification when distributing the corresponding content in overseas markets.

모니터링 대상 콘텐츠 수집을 위한 딥러닝 기술로서 영상 이미지 + 게시물 텍스트 데이터 활용, 영상과 텍스트의 상관관계가 융합된 지식베이스 활용, 정보 누락 등 불확실한 환경에서도 유연한 대응이 가능해지고, 저작권 콘텐츠를 선정하여 모니터링 하되, 사이트를 한정하지 않는 방식으로 진행. 기존 대비 대상 저작권 콘텐츠의 위반 여부 및 유통 현황 파악에 유리 하다.As a deep learning technology for collecting content to be monitored, it enables flexible responses in uncertain environments such as video image + post text data use, a knowledge base that combines video and text correlation, and omission of information, and selects and monitors copyrighted content. , proceeding in a non-site manner. Compared to the existing ones, it is advantageous to check whether the target copyright content has been violated and the current distribution status.

불법 사이트 IP 추적 및 IP를 기반 지리위치정보(Geolocation) 활용으로 서버위치 추적 지리위치정보 활용으로, 국가별 불법 유통 현황 및 통계 정보 제공를 제공할 수 있다.By tracking illegal site IP and using IP-based geolocation information to track server location, it is possible to provide illegal distribution status and statistical information for each country by using geolocation information.

Claims (10)

저작권 보호 대상 디지털 콘텐츠를 유통하는 하나 이상의 온라인 서비스 제공자 서버; 및
하나 이상의 국가별 콘텐츠 사이트에서 추출된 상기 디지털 콘텐츠의 영상 정보 텍스트로부터 추출된 키워드와 상기 디지털 콘텐츠 영상으로부터 프레임 단위 이미지 추출하여 저작권 정보로 등록하고, 상기 저작권 정보의 딥러닝을 통한 유사도 계산으로 상기 디지털 콘텐츠를 유통하는 웹페이지 정보를 수집하고 상기 웹페이지를 운영하는 온라인 서비스 제공자 서버에 과금하는 저작권 보호 메인 서버;
를 포함하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
one or more online service provider servers that distribute copyrighted digital content; and
A keyword extracted from the image information text of the digital content extracted from one or more country-specific content sites and a frame-by-frame image extracted from the digital content image are registered as copyright information, and the digital content is calculated by similarity calculation through deep learning of the copyright information. a copyright protection main server that collects web page information distributing content and charges an online service provider server that operates the web page;
Content registration and billing system for digital content copyright protection, including.
제 1 항에 있어서,
상기 저작권 보호 메인 서버는
상기 저작권 정보를 블록체인 네트워크에 분산하여 등록하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server is
Content registration and billing system for digital content copyright protection, characterized in that the copyright information is distributed and registered in a blockchain network.
제 1 항에 있어서,
상기 저작권 보호 메인 서버는
상기 디지털 콘텐츠의 예고편 영상으로부터 프레임 단위 이미지 추출하여 콘텐츠 별 딥러닝을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server is
Content registration and billing system for digital content copyright protection, characterized in that by extracting frame-by-frame images from the trailer image of the digital content and performing deep learning for each content.
제 1 항에 있어서,
상기 저작권 보호 메인 서버는 하나 이상의 상기 온라인 서비스 제공 서버 중 접속 차단 및 장애 발생 시 HTML 및 로그 분석을 통해 접속 오류 및 접속 제한을 검출하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server is a content registration and billing system for digital content copyright protection, characterized in that it detects access errors and access restrictions through HTML and log analysis when an access block or failure occurs among one or more of the online service providing servers.
제 4 항에 있어서,
상기 저작권 보호 메인 서버는 접속 장애 원인을 분석하고, 상기 장애 원인에 따른 이벤트 처리 및 수집 재수행을 처리하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
5. The method of claim 4,
The copyright protection main server analyzes the cause of the access failure, and the content registration and billing system for digital content copyright protection, characterized in that it handles event processing and collection re-performation according to the failure cause.
제 4 항에 있어서,
상기 저작권 보호 메인 서버는 레플리카 서버를 추가로 포함하고,
접속 장애 발생 시 상기 레플리카 서버가 상기 디지털 콘텐츠 유통 페이지 수집 역할을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
5. The method of claim 4,
The copyright protection main server further includes a replica server,
Content registration and billing system for digital content copyright protection, characterized in that the replica server serves to collect the digital content distribution page when an access failure occurs.
제 1 항에 있어서,
상기 저작권 보호 메인 서버는
상기 디지털 콘텐츠를 유통하는 웹페이지의 페이지뷰, 로그인 정보를 통해 상기 디지털 콘텐츠 사용료를 과금하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server is
A content registration and billing system for digital content copyright protection in which the digital content usage fee is charged through page views and login information of a web page that distributes the digital content.
제 1 항에 있어서,
상기 저작권 보호 메인 서버는,
상기 디지털 콘텐츠의 주요 정보에서 복수개의 키워드를 추출하고,
상기 복수개의 키워드는 해당 국가 언어 포탈에 업로드된 상기 디지털 콘텐츠의 요약 정보 또는 소개 자료에서 추출하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server,
extracting a plurality of keywords from the main information of the digital content,
The plurality of keywords is a content registration and billing system for digital content copyright protection, characterized in that it is extracted from summary information or introduction material of the digital content uploaded to the national language portal.
제 4 항에 있어서,
상기 레플리카 서버는 상기 저작권 보호 메인 서버와 IP가 다른 서버로 접속 차단 감지 시 상기 저작권 보호 메인 서버의 상기 수집 동작은 중단하고 상기 레플리카 서버가 상기 수집 동작을 수행하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
5. The method of claim 4,
The replica server stops the collection operation of the copyright protection main server and the replica server performs the collection operation when it detects that access to a server having a different IP from the copyright protection main server is detected. content registration and billing system for
제 1 항에 있어서,
상기 저작권 보호 메인 서버는
상기 디지털 콘텐츠를 유통하는 웹페이지 정보에서 지리적 정보를 추출하여 국가별 디지털 콘텐츠 소비 통계를 제공하는 것을 특징으로 하는 디지털 콘텐츠 저작권 보호를 위한 콘텐츠 등록 및 빌링 시스템.
The method of claim 1,
The copyright protection main server is
Content registration and billing system for digital content copyright protection, characterized in that by extracting geographic information from the web page information distributing the digital content, and providing digital content consumption statistics by country.
KR1020190154522A 2019-11-27 2019-11-27 Contents registering and billing system and method for digital contents copyright protection KR20210065588A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190154522A KR20210065588A (en) 2019-11-27 2019-11-27 Contents registering and billing system and method for digital contents copyright protection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190154522A KR20210065588A (en) 2019-11-27 2019-11-27 Contents registering and billing system and method for digital contents copyright protection

Publications (1)

Publication Number Publication Date
KR20210065588A true KR20210065588A (en) 2021-06-04

Family

ID=76392071

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190154522A KR20210065588A (en) 2019-11-27 2019-11-27 Contents registering and billing system and method for digital contents copyright protection

Country Status (1)

Country Link
KR (1) KR20210065588A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102506257B1 (en) * 2022-07-06 2023-03-03 채기병 Method, System, Service Server and Computer-Readable Medium for Sound Source Usage Log and Sound Source Copyright Holder Matching
KR102551004B1 (en) * 2022-03-31 2023-07-04 넥스터 주식회사 The methods and systems of copyright infringement analysis through similarity analysis of contents which created by users in virtual reality modeling the real world
KR102594382B1 (en) * 2023-06-20 2023-10-26 주식회사 쿵월드 System to detect copyright of contents and prevent illegal use of copyrighted contents based on artificial intelligence

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010087808A (en) 2000-06-10 2001-09-26 최종욱 System and method of providing and authenticating works of authorship based on watermarking technique
KR20030003412A (en) 2001-06-30 2003-01-10 주식회사 케이티 Method of multimedia content service in internet content service system
KR20090112259A (en) 2008-04-24 2009-10-28 주식회사 케이티 Content Management System and Method for Digital Content Service
KR20100020658A (en) 2008-08-13 2010-02-23 씨네이십일아이 주식회사 Method of managingcontents data in contents data managing server and in contents data managing server

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010087808A (en) 2000-06-10 2001-09-26 최종욱 System and method of providing and authenticating works of authorship based on watermarking technique
KR20030003412A (en) 2001-06-30 2003-01-10 주식회사 케이티 Method of multimedia content service in internet content service system
KR20090112259A (en) 2008-04-24 2009-10-28 주식회사 케이티 Content Management System and Method for Digital Content Service
KR20100020658A (en) 2008-08-13 2010-02-23 씨네이십일아이 주식회사 Method of managingcontents data in contents data managing server and in contents data managing server

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102551004B1 (en) * 2022-03-31 2023-07-04 넥스터 주식회사 The methods and systems of copyright infringement analysis through similarity analysis of contents which created by users in virtual reality modeling the real world
KR102506257B1 (en) * 2022-07-06 2023-03-03 채기병 Method, System, Service Server and Computer-Readable Medium for Sound Source Usage Log and Sound Source Copyright Holder Matching
KR102594382B1 (en) * 2023-06-20 2023-10-26 주식회사 쿵월드 System to detect copyright of contents and prevent illegal use of copyrighted contents based on artificial intelligence

Similar Documents

Publication Publication Date Title
JP4964966B2 (en) Method and system for detecting and reporting unapproved content
CN110069661B (en) Linking content files
US20200160466A1 (en) Content contract in blockchain, and content management system and content provision method using same
JP5546246B2 (en) Content management system
DE60030814T2 (en) Secure distribution of electronic content on CDs and DVDs
US20070217648A1 (en) Fingerprinting Digital Media Content
US20070220592A1 (en) Comparing Media Files Against Database Content
CN1672155A (en) Method and device for regulating file sharing
US20020168082A1 (en) Real-time, distributed, transactional, hybrid watermarking method to provide trace-ability and copyright protection of digital content in peer-to-peer networks
US20070234398A1 (en) Controlling Access to Digital Media Content
US20070208715A1 (en) Assigning Unique Content Identifiers to Digital Media Content
KR20210065588A (en) Contents registering and billing system and method for digital contents copyright protection
AU2016269473B2 (en) Rights clearance for granular rights
US20080235795A1 (en) System and Method for Confirming Digital Content
US20120173441A1 (en) Ownership Resolution System
US10303781B1 (en) Deriving associations between assets
KR100755006B1 (en) File identification system in distributed network and Method thereof
US20070208763A1 (en) Computer Database Record Architecture Based on a Unique Internet Media Identifier
US9977877B2 (en) System and method for terminating copyright infringement by BitTorrent users
Favale Bouncing back from oblivion: can reversionary copyright help unlocking orphan works?
KR102176326B1 (en) Contents protection system
KR20220055131A (en) System for global based contents usage management
Huang et al. Understanding the Brains and Brawn of Illicit Streaming App
KR101976802B1 (en) A Contents Monitering System For Protection Of Copyright
KR101652498B1 (en) Managing system and method for copyright of scanned book

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application