KR102340963B1 - Method and Apparatus for Producing Video Based on Artificial Intelligence - Google Patents

Method and Apparatus for Producing Video Based on Artificial Intelligence Download PDF

Info

Publication number
KR102340963B1
KR102340963B1 KR1020210038492A KR20210038492A KR102340963B1 KR 102340963 B1 KR102340963 B1 KR 102340963B1 KR 1020210038492 A KR1020210038492 A KR 1020210038492A KR 20210038492 A KR20210038492 A KR 20210038492A KR 102340963 B1 KR102340963 B1 KR 102340963B1
Authority
KR
South Korea
Prior art keywords
image
video
information
production apparatus
producer
Prior art date
Application number
KR1020210038492A
Other languages
Korean (ko)
Inventor
박현준
Original Assignee
주식회사 파인드커넥트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 파인드커넥트 filed Critical 주식회사 파인드커넥트
Application granted granted Critical
Publication of KR102340963B1 publication Critical patent/KR102340963B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8541Content authoring involving branching, e.g. to different story endings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Disclosed are an AI-based video production method and a device. The embodiment of the present invention provides an AI-based video production method and a device, which receives a keyword input by a producer, extracts a reference image corresponding to the keyword based on AI, extracts a data image corresponding to an analysis result of analyzing image information based on AI when receiving the image information input by a producer to produce an image by combining the reference image and the data image.

Description

AI 기반의 영상 제작 방법 및 장치{Method and Apparatus for Producing Video Based on Artificial Intelligence}AI-based video production method and apparatus {Method and Apparatus for Producing Video Based on Artificial Intelligence}

본 발명의 일 실시예는 AI 기반의 영상 제작 방법 및 장치에 관한 것이다. An embodiment of the present invention relates to an AI-based image production method and apparatus.

이하에 기술되는 내용은 단순히 본 실시예와 관련되는 배경 정보만을 제공할 뿐 종래기술을 구성하는 것이 아니다.The content described below merely provides background information related to the present embodiment and does not constitute the prior art.

인터넷이 급속히 보급되면서 전자 메일을 이용한 광고, 홈페이지 배너(Banner) 광고, 동영상 컨텐츠 광고 등의 새로운 형식의 광고가 생겨났다. 인터넷을 기반으로 전자상거래, 전자광고, 인터넷 폰 등 다양한 서비스들이 제공되고 있다. 사용자들이 인터넷을 이용하여 손쉽게 서비스를 받을 수 있다. With the rapid spread of the Internet, new types of advertisements such as advertisements using e-mail, homepage banner advertisements, and video content advertisements have emerged. Based on the Internet, various services such as e-commerce, electronic advertisement, and Internet phone are provided. Users can easily receive services using the Internet.

인터넷상에서 특정한 자료를 검색하는 서비스는 인터넷을 효율적으로 이용하기 위해 필수적인 서비스로 인식되고 있다. 다시 말해, 사용자가 특정 자료를 검색하려는 경우 해당 사이트의 URL이나 IP 주소를 알지 못하더라도 정보 검색 시스템을 이용한 인터넷 검색 서비스를 제공하는 사이트에 접속하고, 검색하려는 자료의 키워드를 입력함으로써 원하는 결과 데이터를 서비스받을 수 있다.A service for searching specific data on the Internet is recognized as an essential service to use the Internet efficiently. In other words, when a user wants to search for a specific material, even if he or she does not know the URL or IP address of the site, he or she accesses a site that provides Internet search service using the information retrieval system and enters the keyword of the desired material to retrieve the desired result data. service can be obtained.

다양한 신기술을 흡수하며 진화해온 광고 및 미디어 산업이 최근 AI(Artificial Intelligence)와의 접목을 모색하고 있다. 광고와 미디어 시장의 포화에 따른 경쟁 격화와 기계가 스스로 학습할 수 있는 머신 러닝 기술의 급속한 발전 및 AI를 구동할 수 있는 컴퓨터 비용의 하락 등이 AI 기술을 적용한 광고 기술의 발전을 가속화하고 있다.The advertising and media industry, which has evolved by absorbing various new technologies, is recently seeking to combine it with AI (Artificial Intelligence). Intensifying competition due to the saturation of the advertising and media markets, the rapid development of machine learning technology that allows machines to learn on their own, and the drop in the cost of computers that can drive AI are accelerating the development of advertising technology using AI technology.

미디어 산업은 제작과 유통 및 시청자 대응 등 다양한 영역에 걸쳐 AI를 활용하고 있다. AI는 미래 광고 및 미디어 산업에서 없어서는 안 될 존재로 점차 입지를 굳히고 있는 것으로 판단된다.The media industry is using AI in various areas, including production, distribution, and audience response. It is judged that AI is gradually solidifying its position as an indispensable existence in the future advertising and media industry.

광고를 한다는 것은 일종의 추천 엔진을 가동하는 것인데 딥 러닝은 추천에 탁월한 능력을 가지고 있다. 프로그래밍된 광고를 타겟팅시 머신 러닝은 사용자의 광고 클릭률을 높이며 리타겟팅(Retargeting)시 최적의 제품 조합과 광고 카피를 선택하도록 할 수 있다.Advertisement is to run a kind of recommendation engine, and deep learning has an excellent ability to recommend. When targeting programmed advertisements, machine learning can increase the user's click-through rate on advertisements and select the optimal product combination and advertisement copy for retargeting.

디지털 시대가 가속화되면서 더 많은 영상 콘텐츠의 제작이 필요하다. 4차 산업시대로의 진입과 코로나 팬데믹으로 이해 비대면 서비스의 시장이 빠르게 확산되고 있으며, 온라인 시대를 맞이하여, 기업과 소비자 모두 영상 콘텐츠 제작의 니즈가 강화되었다. As the digital era accelerates, the production of more video content is necessary. The market for non-face-to-face services is rapidly expanding due to the entry into the 4th industrial era and the corona pandemic, and in the online era, both companies and consumers have strengthened the needs of video content production.

기업들은 온라인 채널을 통해 브랜드 및 제품을 홍보 및 광고 목적으로 영상을 제작을 필요로 하고 있으며, 개인들 역시 각자의 일상 및 재능을 영상으로 제작하여 소통하는 기술을 필요로 한다.Companies need to produce videos for the purpose of promoting and advertising their brands and products through online channels, and individuals also need the skills to communicate their daily lives and talents through videos.

본 실시예는 제작자가 입력한 키워드를 수신하면, AI를 기반으로 키워드에 대응하는 레퍼런스 영상을 추출하고, 제작자가 입력한 영상 정보를 수신하면, AI를 기반으로 영상 정보를 분석한 분석 결과에 대응하는 데이터 영상을 추출하고, 레퍼런스 영상과 데이터 영상을 조합하여 영상을 제작하도록 하는 AI 기반의 영상 제작 방법 및 장치를 제공하는 데 목적이 있다.In this embodiment, when a keyword input by the producer is received, a reference image corresponding to the keyword is extracted based on AI, and when the image information input by the producer is received, it corresponds to the analysis result of analyzing the image information based on AI An object of the present invention is to provide an AI-based image production method and apparatus that extracts a data image and produces an image by combining a reference image and data image.

본 실시예의 일 측면에 의하면, 제작자 단말기로부터 키워드를 입력받는 키워드 입력부; 복수의 동영상 제공장치로부터 상기 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나 이상을 추출하여 레퍼런스 영상을 생성하는 레퍼런스 영상 생성부; 상기 제작자 단말기로부터 영상 정보를 입력받는 영상 정보 입력부; 상기 영상 정보를 분석한 분석 결과를 생성하고, 복수의 상기 동영상 제공장치로부터 상기 분석 결과에 대응하는 데이터를 추출하여 맞춤 영상을 생성하는 맞춤 영상 생성부; 및 상기 레퍼런스 영상과 상기 맞춤 영상을 조합하여 영상을 제작하는 영상 제작부를 포함하는 것을 특징으로 하는 영상 제작장치를 제공한다.According to an aspect of the present embodiment, a keyword input unit for receiving a keyword from a producer terminal; a reference image generator for generating a reference image by extracting at least one of a background screen, music, and text corresponding to the keyword from a plurality of video providing devices; an image information input unit for receiving image information from the producer terminal; a customized image generator for generating an analysis result of analyzing the image information, and extracting data corresponding to the analysis result from a plurality of video providing devices to generate a customized image; and an image production unit configured to produce an image by combining the reference image and the custom image.

본 실시예의 다른 측면에 의하면, 영상 제작장치에서 제작자 단말기로부터 키워드를 입력받는 과정; 상기 영상 제작장치에서 복수의 동영상 제공장치로부터 상기 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나 이상을 추출하여 레퍼런스 영상을 생성하는 과정; 상기 영상 제작장치에서 상기 제작자 단말기로부터 영상 정보를 입력받는 과정; 상기 영상 제작장치에서 상기 영상 정보를 분석한 분석 결과를 생성하고, 복수의 상기 동영상 제공장치로부터 상기 분석 결과에 대응하는 데이터를 추출하여 맞춤 영상을 생성하는 과정; 및 상기 영상 제작장치에서 상기 레퍼런스 영상과 상기 맞춤 영상을 조합하여 영상을 제작하는 과정을 포함하는 것을 특징으로 하는 영상 제작 방법을 제공한다.According to another aspect of the present embodiment, the process of receiving a keyword from a producer terminal in the video production apparatus; generating a reference image by extracting at least one of a background screen, music, and text corresponding to the keyword from a plurality of video providing devices in the image production apparatus; receiving image information from the producer terminal in the image production apparatus; generating an analysis result obtained by analyzing the image information in the image production apparatus, and extracting data corresponding to the analysis result from a plurality of video providing apparatuses to generate a customized image; and combining the reference image and the custom image in the image production apparatus to produce an image.

이상에서 설명한 바와 같이 본 실시예에 의하면, 제작자가 입력한 키워드를 수신하면, AI를 기반으로 키워드에 대응하는 레퍼런스 영상을 추출하고, 제작자가 입력한 영상 정보를 수신하면, AI를 기반으로 영상 정보를 분석한 분석 결과에 대응하는 데이터 영상을 추출하고, 레퍼런스 영상과 데이터 영상을 조합하여 영상을 제작할 수 있는 효과가 있다.As described above, according to this embodiment, when a keyword input by the producer is received, a reference image corresponding to the keyword is extracted based on AI, and when the image information input by the producer is received, image information is based on AI It has the effect of extracting a data image corresponding to the analysis result of analyzing the data and producing an image by combining the reference image and the data image.

본 실시예에 의하면, AI을 기반으로 사용자의 입력 정보(키워드, 영상 정보)에 따라 사용자에게 맞춤형 영상이 제작될 수 있는 효과가 있다. 본 실시예에 의하면, AI 영상 제작 기술로 저렴하고 빠르고 퀄리티가 높은 광고 영상을 개인부터 기업까지 쉽게 제작할 수 있도록 한다.According to this embodiment, there is an effect that a customized image can be produced for the user according to the user's input information (keyword, image information) based on AI. According to this embodiment, it is possible to easily produce inexpensive, fast, and high-quality advertisement images from individuals to companies using AI image production technology.

도 1은 본 실시예에 따른 AI 기반의 영상 제작 시스템을 개략적으로 나타낸 도면이다.
도 2는 본 실시예에 따른 영상 제작장치를 개략적으로 나타낸 블럭 구성도이다.
도 3은 본 실시예에 따른 AI 기반의 영상 제작 방법을 설명하기 위한 순서도이다.
도 4는 본 실시예에 따른 복수의 영상 제작하는 방법을 나타낸 도면이다.
도 5는 본 실시예에 따른 영상 결과에 따라 영상 타겟팅 방법을 나타낸 도면 이다.
도 6은 본 실시예에 따른 제작자 정보와 영상 타겟팅 정보를 대응시키기 위해 클러스터링 방법을 나타낸 도면이다.
도 7은 본 실시예에 따른 영상 제작장치의 영상 최적화 방법을 나타낸 도면이다.
도 8은 본 실시예에 따른 영상 제작장치의 영상 클릭률 확률 분포의 예측 방법을 나타낸 도면이다.
1 is a diagram schematically showing an AI-based image production system according to the present embodiment.
2 is a block diagram schematically showing an image production apparatus according to the present embodiment.
3 is a flowchart illustrating an AI-based image production method according to the present embodiment.
4 is a view showing a method of producing a plurality of images according to the present embodiment.
5 is a diagram illustrating an image targeting method according to an image result according to the present embodiment.
6 is a diagram illustrating a clustering method in order to match producer information and image targeting information according to the present embodiment.
7 is a diagram illustrating an image optimization method of the image production apparatus according to the present embodiment.
8 is a diagram illustrating a method of predicting an image click-through rate probability distribution of the image production apparatus according to the present embodiment.

이하, 본 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, this embodiment will be described in detail with reference to the accompanying drawings.

도 1은 본 실시예에 따른 AI 기반의 영상 제작 시스템을 개략적으로 나타낸 도면이다.1 is a diagram schematically showing an AI-based image production system according to the present embodiment.

본 실시예에 따른 영상 제작 시스템은 제작자 단말기(110), 네트워크(120), 영상 제작장치(130), 동영상 제공장치(140)를 포함한다. 영상 제작 시스템에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The image production system according to the present embodiment includes a producer terminal 110 , a network 120 , an image production device 130 , and a video providing device 140 . Components included in the video production system are not necessarily limited thereto.

제작자 단말기(110)는 제작자의 키 조작에 따라 네트워크(120)를 경유하여 음성 또는 데이터 통신을 수행하는 전자 기기를 의미한다. 제작자 단말기(110)는 네트워크(120)를 경유하여 영상 제작장치(130)와 통신하기 위한 프로그램 또는 프로토콜을 저장하기 위한 메모리, 해당 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비한다. The manufacturer's terminal 110 refers to an electronic device that performs voice or data communication via the network 120 according to the manufacturer's key manipulation. The producer terminal 110 includes a memory for storing a program or protocol for communicating with the image production apparatus 130 via the network 120 , and a microprocessor for executing and controlling the corresponding program.

제작자 단말기(110)는 스마트폰(Smart Phone), 태블릿(Tablet), 랩톱(Laptop), 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 무선 통신 단말기(Wireless Communication Terminal), 미디어 플레이어 등과 같은 전자 기기일 수 있다. The manufacturer's terminal 110 includes a smart phone, a tablet, a laptop, a personal digital assistant (PDA), a portable multimedia player (PMP), and a wireless communication terminal (Wireless). Communication Terminal), an electronic device such as a media player.

제작자 단말기(110)는 제작자의 조작 또는 명령에 의해 키워드 또는 영상 정보를 입력받으며, 키워드 또는 영상 정보를 영상 제작장치(130)로 전송한다.The producer terminal 110 receives keywords or image information according to the manipulation or command of the producer, and transmits the keyword or image information to the image production apparatus 130 .

네트워크(120)는 인터넷망, 인트라넷망, 이동통신망, 위성 통신망 등 다양한 유무선 통신 기술을 이용하여 인터넷 프로토콜로 데이터를 송수신할 수 있는 망을 의미한다. The network 120 refers to a network capable of transmitting and receiving data using an Internet protocol using various wired and wireless communication technologies, such as an Internet network, an intranet network, a mobile communication network, and a satellite communication network.

영상 제작장치(130)는 웹서버 또는 네트워크 서버의 형태로 구현될 수 있다. 영상 제작장치(130)는 일반적으로 인터넷과 같은 개방형 컴퓨터 네트워크를 경유하여 불특정 다수 클라이언트 또는 다른 서버와 통신한다. 영상 제작장치(130)는 클라이언트 또는 다른 웹서버의 작업수행 요청에 대응하는 작업 결과를 도출하여 제공하는 컴퓨터 시스템, 컴퓨터 소프트웨어(웹서버 프로그램)를 의미한다.The image production apparatus 130 may be implemented in the form of a web server or a network server. The image production apparatus 130 generally communicates with an unspecified number of clients or other servers via an open computer network such as the Internet. The image production apparatus 130 refers to a computer system and computer software (web server program) that derives and provides a work result corresponding to a work performance request of a client or other web server.

영상 제작장치(130)는 전술한 웹서버 프로그램 이외에, 웹서버상에서 동작하는 일련의 응용 프로그램(Application Program) 또는 장치 내부에 구축되어 있는 각종 데이터베이스를 포함한다.In addition to the above-described web server program, the image production apparatus 130 includes a series of application programs operating on the web server or various databases built in the device.

본 실시예에 따른 영상 제작장치(130)는 영상 제작에 필요한 정보를 제작자 단말기(110)로부터 입력받은 후 AI 머신러닝과 딥러닝을 이용하여 AI가 필요한 영상 데이터를 배합하여, 제작자가 원하는 영상을 제작한다.The image production apparatus 130 according to the present embodiment receives the information necessary for image production from the producer terminal 110, and then uses AI machine learning and deep learning to combine the image data required for AI, thereby producing the image desired by the producer. produce

영상 제작장치(130)는 머신러닝 및 딥러닝을 이용한 AI 영상제작 기술로 새롭게 촬영한 영상이 아닌, 애니메이션, 편집영상, 인포그래픽 등 기존에 생성된 영상 데이터를 이용하여 영상을 제작한다. 영상 제작장치(130)는 AI 영상 제작 기술로 저렴하고 빠르고 퀄리티가 높은 영상을 개인부터 기업까지 쉽게 제작할 수 있도록 한다.The image production device 130 produces an image using previously generated image data such as animation, edited image, infographic, etc., rather than a newly shot image with AI image production technology using machine learning and deep learning. The video production device 130 allows individuals to businesses to easily produce inexpensive, fast, and high-quality videos with AI video production technology.

영상 제작장치(130)는 AI를 이용한 레퍼런스 영상과 맞춤 영상을 조합하여 영상을 제작한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 영상 소스를 입력받은 후 영상 소스와 어울리는 배경화면, 음악, 텍스트를 추출한 후 AI 기반으로 결합하여 하나의 영상을 생성한다.The image production apparatus 130 produces an image by combining a reference image and a custom image using AI. After receiving an image source from the producer terminal 110 , the image production apparatus 130 extracts a background screen, music, and text matching the image source, and then combines them based on AI to generate one image.

영상 제작장치(130)는 제작자 단말기(110)로부터 키워드를 입력받고, AI를 이용하여 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나를 포함하는 레퍼런스 영상을 추출한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 문구를 입력받고, AI를 이용하여 문구를 분석한 분석 결과를 생성하고, 분석 결과를 기반으로 맞춤 영상을 추출한다. 영상 제작장치(130)는 레퍼런스 영상과 맞춤 영상을 조합하여 영상을 제작한다.The image production apparatus 130 receives a keyword from the producer terminal 110 and extracts a reference image including at least one of a background screen, music, and text corresponding to the keyword using AI. The image production apparatus 130 receives a phrase from the producer terminal 110, generates an analysis result by analyzing the phrase using AI, and extracts a customized image based on the analysis result. The image production apparatus 130 produces an image by combining a reference image and a custom image.

영상 제작장치(130)는 제작자 단말기(110)로부터 키워드를 입력받으면, AI를 이용하여 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나를 포함하는 레퍼런스 영상을 추출한다. 예컨대, 영상 제작장치(130)는 제작자 단말기(110)로부터 키워드로 ‘20대 여자 색조화장품’을 입력받는다. 즉, 제작자 단말기(110)는 제작자의 조작 또는 명령에 의해 ‘20대 여자 색조화장품’을 키워드로 입력받아 영상 제작장치(130)로 전송한다.When receiving a keyword from the producer terminal 110 , the image production apparatus 130 extracts a reference image including at least one of a background screen, music, and text corresponding to the keyword using AI. For example, the image production apparatus 130 receives 'color cosmetics for women in their twenties' as a keyword from the producer terminal 110 . That is, the producer terminal 110 receives 'color cosmetics for women in their twenties' as a keyword by the manufacturer's manipulation or command, and transmits it to the image production device 130 .

영상 제작장치(130)는 ‘20대 여자 색조화장품’을 입력한 사용자가 해당 계정으로 최초 로그인한 경우, AI를 이용하여 최근 5년간 ‘20대 여자 색조화장품’에 해당하는 가장 높은 연관성을 갖는 영상을 리스트화(예컨대, 100개)하여 제작자 단말기(110)로 출력한다.The image production device 130 uses AI when a user who has entered 'color cosmetics for women in their twenties' first logs in to the account, and the image with the highest correlation for the last 5 years using AI are listed (eg, 100) and output to the manufacturer terminal 110 .

영상 제작장치(130)는 입력된 키워드를 데이터 기준으로 추출한다. 영상 제작장치(130)는 복수의 동영상 제공장치(140)(예컨대, 유튜브, 페이스북, 인스타그램, 네이버 TV, 카카오 TV 등)로부터 입력된 키워드에 대응하는 영상 중 조회수, 좋아요, 댓글수, 공유 횟수 중 하나 이상의 정보를 기반으로 1차적으로 높은 연관성을 갖는 영상으로 추출한다.The image production apparatus 130 extracts the input keyword based on the data. The video production device 130 includes the number of views, likes, comments, Based on one or more pieces of information among the number of shares, it is primarily extracted as an image with high correlation.

영상 제작장치(130)는 복수의 동영상 제공장치(140)로부터 입력된 키워드에 대응하는 영상 중 CF(Commercial Film) 수상실적을 갖는 영상을 객관적인 지표로서 데이터를 리스트화시켜 2차적으로 높은 연관성을 갖는 영상으로 추출한다.The image production device 130 lists data as an objective indicator of an image having a CF (Commercial Film) award among images corresponding to the keyword input from the plurality of moving image providing devices 140 to have a secondary high correlation. Extract from video

영상 제작장치(130)는 1차적으로 높은 연관성을 갖는 영상과 2차적으로 높은 연관성을 갖는 영상을 기반으로 레퍼런스 영상을 제공한다. 영상 제작장치(130)는 동영상 제공장치(140)로부터 키워드에 대응하는 영상, 음악, 텍스트를 검색하더라도 내부적으로 학습된 AI를 이용하여 키워드와 높은 연관성을 갖는 영상을 추출한다. The image production apparatus 130 provides a reference image based on an image having a primary high correlation and an image having a secondary high correlation. The image production apparatus 130 extracts an image having a high correlation with the keyword using the internally learned AI even if the image, music, and text corresponding to the keyword are searched from the video providing apparatus 140 .

영상 제작장치(130)는 제작자 단말기(110)로부터 입력받은 키워드와 높은 연관성을 갖는 영상을 기 설정된 개수 단위로 리스트화여 출력한다. 영상 제작장치(130)는 리스트화되어 출력된 영상 중 제작자 단말기(110)가 선택한 영상을 재생시킨다.The image production apparatus 130 lists and outputs the images having a high correlation with the keyword input from the producer terminal 110 in units of a preset number. The image production apparatus 130 reproduces an image selected by the producer terminal 110 from among the listed and output images.

영상 제작장치(130)는 리스트화되어 출력된 영상 중 제작자 단말기(110)가 재생시킨 영상의 재생시간, 재생완성률을 기반으로 AI를 학습시킨다. AI는 재생시킨 영상의 재생시간, 재생완성률을 기반으로 제작자의 선호도를 입력받아 학습한다. 영상 제작장치(130)는 학습한 제작자의 선호도를 기반으로 유사한 영상을 추가로 검색하여 리스트화하여 출력한다.The video production apparatus 130 learns the AI based on the reproduction time and reproduction completion rate of the video reproduced by the producer terminal 110 among the listed and output videos. AI learns by inputting the producer's preference based on the playback time and playback completion rate of the reproduced video. The image production apparatus 130 additionally searches for similar images based on the learned producer's preference, lists them, and outputs them.

영상 제작장치(130)는 재생시킨 영상의 재생시간, 재생완성률, 재생 구간을 기반으로 제작자 선호도를 파악한다. 영상 제작장치(130)는 제작자 선호도를 파악하기 위해 영상 각각의 총 재생시간을 기반으로 재생 구간을 분할한다. 영상 제작장치(130)는 총 재생시간 대비 영상의 재생시간을 기반으로 재생 완성률을 확인한다.The video production apparatus 130 identifies the producer's preference based on the reproduction time, reproduction completion rate, and reproduction section of the reproduced video. The video production apparatus 130 divides the playback section based on the total playback time of each video in order to determine the producer preference. The video production apparatus 130 checks the reproduction completion rate based on the reproduction time of the video compared to the total reproduction time.

영상 제작장치(130)는 전체재생구간을 임의의 구간(예컨대, 3%, 10%, 25%, 50%, 75%, 100%)으로 분할한다. 영상 제작장치(130)는 재생 구간이 길수록 해당 영상과 제작자 선호도가 부합하는 것으로 파악한다. 다시 말해, 영상 제작장치(130)는 재생 구간이 임의의 구간 중 100%에 해당하는 구간인 경우, 제작자가 해당 영상을 최상위 선호하는 것으로 제작자 선호를 파악한다. The image production apparatus 130 divides the entire playback section into arbitrary sections (eg, 3%, 10%, 25%, 50%, 75%, 100%). The video production apparatus 130 determines that the longer the reproduction section, the more the video and the producer's preference match. In other words, when the reproduction section corresponds to 100% of the arbitrary section, the video production apparatus 130 determines the producer preference as the highest preference for the video by the producer.

영상 제작장치(130)는 제작자가 선별한 영상의 카테고리 별로 제작자 선호도를 파악한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 키워드 또는 문구를 입력받으면, 제작자 단말기(110)에 대응하는 제작자 계정에서 기 설정한 카테고리 정보를 확인한다.The image production apparatus 130 identifies the producer's preference for each category of the image selected by the producer. When the video production apparatus 130 receives a keyword or phrase from the producer terminal 110 , the video production apparatus 130 checks the category information set in the producer account corresponding to the producer terminal 110 .

영상 제작장치(130)는 제작자 계정에서 기 설정한 카테고리(IT, 트렌드, 진중한, 밝은, 화사한, 아기자기한, 도시적인)를 확인한다. 영상 제작장치(130)는 레퍼런스 영상을 생성할 때, AI를 이용하여 키워드 및 기 설정한 카테고리에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나를 포함하는 영상을 추출한다.The video production device 130 checks the categories (IT, trend, serious, bright, bright, cute, urban) set in the producer account. When generating the reference image, the image production apparatus 130 extracts an image including at least one of a background screen, music, and text corresponding to a keyword and a preset category using AI.

영상 제작장치(130)는 맞춤 영상을 생성할 때, AI를 이용하여 문구를 분석한 분석 결과 및 기 설정한 카테고리에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나를 포함하는 영상을 추출한다.When generating a customized image, the image production apparatus 130 extracts an image including at least one of a background screen, music, and text corresponding to an analysis result of analyzing a phrase using AI and a preset category.

영상 제작장치(130)는 제작자 단말기(110)의 조작 또는 명령에 의해 영상마다 다양한 카테고리로 분류할 수 있다. 영상 제작장치(130)는 제작자 단말기(110)의 조작 또는 명령에 의해 영상의 품질별로 영상을 4K 화질, FHD 화질, HD 화질로 구분한 카테고리로 분리하여 저장한다. 영상 제작장치(130)는 제작자 단말기(110)의 조작 또는 명령에 의해 영상의 장르 별로 홍보영상, 제품영상, 드라마타입, 애니메이션, 인포그래픽, 자연, 인물, 여행, 먹거리, 건물로 구분한 카테고리로 분리하여 저장한다. The image production apparatus 130 may classify each image into various categories according to an operation or a command of the producer terminal 110 . The video production apparatus 130 separates and stores the video into categories divided into 4K video quality, FHD video quality, and HD video quality according to video quality according to an operation or command of the producer terminal 110 . The video production device 130 is a category divided into promotional video, product video, drama type, animation, infographic, nature, person, travel, food, and building for each genre of video by manipulation or command of the producer terminal 110 . Separate and save

영상 제작장치(130)는 제작자 단말기(110)의 조작 또는 명령에 의해 영상 톤별로 역동적인 톤, 화사한 톤, 리드미컬한 톤, 발라드 톤, 드라마타입 톤, 현란한 톤 등으로 구분한 카테고리로 분리하여 저장한다. 영상 제작장치(130)는 AI 머신러닝 기법으로 영상의 카테고리 등을 분류하여, 제작자가 원하는 영상의 카테고리를 분류한다. The video production apparatus 130 separates and stores the video tones into categories divided into dynamic tones, bright tones, rhythmic tones, ballad tones, drama type tones, flashy tones, etc. do. The image production apparatus 130 classifies the category of the image by using an AI machine learning technique, and classifies the category of the image desired by the producer.

영상 제작장치(130)는 제작자 단말기(110)로부터 제작자가 원하는 문구를 입력받으면, AI를 이용하여 문구를 분석한 분석 결과를 기반으로 맞춤 영상을 추출한다. 영상 제작장치(130)는 맞춤 영상을 반영하여 영상을 제작한다. 영상 제작장치(130)는 추가로 제작자 단말기(110)로부터 제작자가 입력한 영상 정보를 입력받는다.When the video production device 130 receives a phrase desired by the producer from the producer terminal 110 , the video production apparatus 130 extracts a customized image based on the analysis result of analyzing the phrase using AI. The image production apparatus 130 produces an image by reflecting the customized image. The image production apparatus 130 additionally receives image information input by the producer from the producer terminal 110 .

예컨대, 영상 제작장치(130)는 제작자 단말기(110)로부터 영상 분량을 ‘30초’로 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 ‘영상 타입’을 인포그래픽, 실사 촬영, 인포그래픽 및 실사촬영 중 어느 하나로 입력받는다.For example, the video production apparatus 130 receives the amount of video from the producer terminal 110 as '30 seconds'. The image production device 130 receives the 'image type' from the producer terminal 110 as any one of infographics, live-action shooting, infographics, and live-action shooting.

영상 제작장치(130)는 제작자 단말기(110)로부터 ‘영상 톤’에 대한 정보를 잔잔한 톤, 역동적인 톤, 드라마적인 톤, 색감있는 톤, 아기자기한 톤 중 어느 하나로 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터‘영상 소스’를 깨끗한 바다, 청량한 느낌, 맑은 자연, 청순한 동양미인, 기초화장품 중 어느 하나로 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 ‘BGM’을 맑고 깨끗한 피아노, 맑은 물소리가 적절히 섞인 BGM 중 어느 하나로 입력받는다.The image production apparatus 130 receives information on 'image tone' from the producer terminal 110 as any one of a calm tone, a dynamic tone, a dramatic tone, a colorful tone, and a cute tone. The video production device 130 receives the 'video source' from the producer terminal 110 as any one of clean sea, refreshing feeling, clear nature, pure oriental beauty, and basic cosmetics. The video production device 130 receives 'BGM' from the producer terminal 110 as any one of a clear piano and a BGM properly mixed with the sound of clear water.

영상 제작장치(130)는 제작자 단말기(110)로부터 문구로 ‘자연 그대로의 순수함을 머금은 순수한 물결’, ‘오늘부터 자연으로 내 피부에 입히세요’ 중 어느 하나를 입력받는다. 영상 제작장치(130)는 로고 삽입으로 첨부 파일로 삽입, 영상 처음 OR 끝에 노출할지 선택 중 어느 하나를 입력받는다. 영상 제작장치(130)는 제작자가 입력한 정보에 맞춰 영상소스, BGM, 문구 등을 AI가 최적화된 영상을 분석해 제작한다.The video production device 130 receives any one of 'pure wave with natural innocence' and 'apply your skin with nature from today' as a phrase from the producer terminal 110 . The image production apparatus 130 receives either one of a selection of whether to be inserted as an attachment by inserting a logo, or to be exposed at the beginning or end of the image. The video production device 130 analyzes and produces an AI-optimized video for video sources, BGM, phrases, etc. according to the information input by the producer.

영상 제작장치(130)는 편집 영상 및 인포그래픽 영상의 수준까지 딥러닝을 이용하여 AI에게 학습시킨다. 영상 제작장치(130)는 출시 후 제작자들이 직접 접속하면서 AI를 이용해 만들면서 데이터를 다시 축적시킨다. 영상 제작장치(130)는 웹소설, 시, 등 ‘긴 문장’이나 ‘철학적인 부분에 대한 고찰’도 시각화시켜 영상 콘텐츠로 제작할 수 있도록 한다. 영상 제작장치(130)는 증강현실 기법도 접목시켜 이질감이 없는 실제 제품이나 사람이 등장시켜서 영상을 제작한다. The video production device 130 teaches AI to the level of edited video and infographic video by using deep learning. The video production device 130 accumulates data again while making it using AI while directly connecting the producers after release. The image production device 130 visualizes 'long sentences' or 'considerations on philosophical parts' such as web novels, poems, etc. to produce image contents. The image production device 130 also grafts augmented reality techniques to produce an image by appearing a real product or person without a sense of heterogeneity.

영상 제작장치(130)는 제작자 단말기(110)로부터 제작자 정보를 수신한다. 영상 제작장치(130)는 제작자 정보를 기반으로 복수의 동영상 제공장치(140) 각각에 대응하는 영상을 생성한다.The video production apparatus 130 receives producer information from the producer terminal 110 . The image production apparatus 130 generates an image corresponding to each of the plurality of video providing apparatuses 140 based on producer information.

영상 제작장치(130)는 복수의 동영상 제공장치(140) 각각에 대응하는 영상을 인터페이스를 통해 복수의 동영상 제공장치(140)로 전송한다. 영상 제작장치(130)는 복수의 동영상 제공장치(140) 각각에 대응되는 복수의 영상에 포함된 대상 객체를 포함하는 영상을 생성한다.The image production apparatus 130 transmits an image corresponding to each of the plurality of video providing apparatuses 140 to the plurality of video providing apparatuses 140 through an interface. The image production apparatus 130 generates an image including a target object included in a plurality of images corresponding to each of the plurality of video providing apparatuses 140 .

영상 제작장치(130)는 복수의 동영상 제공장치(140) 각각에 대응되는 복수의 타겟팅 정보를 생성한다. 영상 제작장치(130)는 제작자 정보에 포함되는 타겟 연령층 정보와 복수의 동영상 제공장치(140) 각각의 나이 카테고리를 기반으로 한 클러스터에 의해 결정된 복수의 타겟팅 정보를 생성한다.The image production apparatus 130 generates a plurality of pieces of targeting information corresponding to each of the plurality of video providing apparatuses 140 . The image production apparatus 130 generates a plurality of targeting information determined by a cluster based on target age group information included in the producer information and each age category of the plurality of video providing apparatuses 140 .

영상 제작장치(130)는 언어 인접도에 의해 클러스터의 중심과 타겟 연령층 정보에 포함되는 나이 지시 단어 간의 거리를 결정한다. 영상 제작장치(130)는 웹 페이지에 포함된 나이 관련 단어에 대한 단어 집합 추출 빈도 및 단어 밀집도를 기반으로 언어 인접도를 결정한다.The image production apparatus 130 determines the distance between the center of the cluster and the age-indicating word included in the target age group information by language proximity. The image production apparatus 130 determines the linguistic adjacency based on the word set extraction frequency and word density for age-related words included in the web page.

영상 제작장치(130)는 AI를 학습시키기 위해 복수의 머신 러닝을 기반으로 영상을 생성한다. 영상 제작장치(130)는 AI 학습을 위해 제1 머신 러닝부, 제2 머신 러닝부 및 제3 머신 러닝부를 포함한다.The image production apparatus 130 generates an image based on a plurality of machine learning in order to learn the AI. The image production apparatus 130 includes a first machine learning unit, a second machine learning unit, and a third machine learning unit for AI learning.

제1 머신 러닝부는 복수의 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려하지 않은 학습 데이터를 기반으로 한 제1 머신 러닝을 수행한다. 제2 머신 러닝부는 복수의 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려한 학습 데이터를 기반으로 한 제2 머신 러닝을 수행한다. 제3 머신 러닝부는 복수의 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려하지 않은 학습 데이터 및 멀티 플랫폼을 고려한 학습 데이터를 기반으로 한 제3 머신 러닝을 수행한다.The first machine learning unit performs first machine learning based on the learning data that does not consider the multi-platform for the plurality of video providing devices 140 . The second machine learning unit performs second machine learning based on the learning data in consideration of the multi-platform for the plurality of video providing devices 140 . The third machine learning unit performs third machine learning based on the learning data considering the multi-platform and the multi-platform learning data for the plurality of video providing devices 140 .

영상 제작장치(130)는 제1 머신 러닝을 기반으로 한 제1 영상, 제2 머신 러닝을 기반으로 한 제2 영상 및 제3 머신 러닝을 기반으로 한 제3 영상을 생성한다. 영상 제작장치(130)는 제1 영상, 제2 영상 및 제3 영상에 대한 제작자 단말기(110)의 선택 결과를 수집한다. 영상 제작장치(130)는 제3 머신 러닝을 위한 멀티 플랫폼을 고려하지 않은 학습 데이터 및 멀티 플랫폼을 고려한 학습 데이터의 비율을 변화시킨다.The image production apparatus 130 generates a first image based on a first machine learning, a second image based on a second machine learning, and a third image based on a third machine learning. The image production apparatus 130 collects selection results of the producer terminal 110 for the first image, the second image, and the third image. The image production apparatus 130 changes the ratio of the learning data that does not consider the multi-platform for the third machine learning and the learning data that considers the multi-platform.

영상 제작장치(130)는 인터페이스를 이용하여 영상을 기반으로 영상 결과 정보를 수신한다. 영상 제작장치(130)는 영상 결과 정보의 분석을 기반으로 영상 또는 복수의 영상 타겟팅 정보 각각에 대한 수정 여부를 결정한다.The image production apparatus 130 receives image result information based on an image using an interface. The image production apparatus 130 determines whether to correct the image or each of the plurality of image targeting information based on the analysis of the image result information.

영상 제작장치(130)는 인공 지능 챗봇을 기반으로 제작자 정보를 수집한다. 영상 제작장치(130)는 인공 지능 챗봇 상에 입력된 제작자 웹 페이지 상의 정보의 스크랩핑을 기반으로 제작자 정보를 수집한다. 영상 제작장치(130)는 인공 지능 챗봇을 이용하여 제작자 단말기(110)로의 질의를 전송하고, 질의에 대한 답변을 기반으로 제작자 정보를 수집한다.The video production device 130 collects creator information based on the artificial intelligence chatbot. The image production apparatus 130 collects producer information based on scraping of information on a producer web page input on the artificial intelligence chatbot. The video production apparatus 130 transmits a query to the producer terminal 110 using an artificial intelligence chatbot, and collects producer information based on the answer to the query.

영상 제작장치(130)는 제작자 정보(미존재)와 관련된 추가적인 질문에 대한 답변을 받지 못하는 경우, 이미 입력받은 제작자 정보(존재)를 기반으로 예측을 수행한다. 영상 제작장치(130)는 예측 정확도가 임계값 이상이라고 판단되는 경우, 예측된 정보를 이용하여 영상을 생성한다. 영상 제작장치(130)는 예측 정확도가 임계값 미만이라고 판단되는 경우, 인공 지능 챗봇을 통해 추가 질문을 생성한다. 영상 제작장치(130)는 제작자 정보(존재)를 기준으로 기존에 입력된 기존 제작자 정보 중 적어도 하나와 비교하여 예측 정확도를 결정한다. 영상 제작장치(130)는 제작자 정보(미존재) 별로 예측을 위해 설정된 제작자 정보(존재) 중 특정 제작자 정보(존재) 및 특정 제작자 정보(존재)에 대한 별도의 가중치를 기반으로 예측 정확도를 결정한다.When the image production apparatus 130 does not receive an answer to an additional question related to producer information (non-existence), the image production apparatus 130 performs prediction based on the already input producer information (existence). When it is determined that the prediction accuracy is greater than or equal to the threshold value, the image production apparatus 130 generates an image by using the predicted information. When it is determined that the prediction accuracy is less than the threshold value, the image production apparatus 130 generates an additional question through the artificial intelligence chatbot. The image production apparatus 130 determines the prediction accuracy by comparing the producer information (existence) with at least one of the existing input producer information. The video production apparatus 130 determines prediction accuracy based on separate weights for specific producer information (existence) and specific producer information (existence) among producer information (existence) set for prediction for each producer information (non-existence). .

영상 제작장치(130)는 AI 기반으로 영상을 디자인한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 제작자 정보를 수신한다. 영상 제작장치(130)는 제작자 정보를 기반으로 복수의 동영상 제공장치(140)에 대한 영상을 각각 생성한다. 영상 제작장치(130)는 영상 각각을 복수의 동영상 제공장치(140) 각각으로 전송한다. 영상 제작장치(130)는 머신 러닝을 기반으로 복수의 동영상 제공장치(140) 각각에 대응하는 영상을 생성한다.The image production apparatus 130 designs an image based on AI. The video production apparatus 130 receives producer information from the producer terminal 110 . The image production apparatus 130 generates images for each of the plurality of video providing apparatuses 140 based on producer information. The image production apparatus 130 transmits each image to each of the plurality of video providing apparatuses 140 . The image production apparatus 130 generates an image corresponding to each of the plurality of video providing apparatuses 140 based on machine learning.

영상 제작장치(130)는 복수의 동영상 제공장치(140) 각각으로 제공되었던 기존의 대상 객체를 입력 정보로서 입력하여 머신 러닝을 수행한다. 영상 제작장치(130)는 머신 러닝을 기반으로 복수의 영상에 포함된 대상 객체의 위치 및/또는 크기의 고려한 영상을 생성한다. 영상 제작장치(130)는 영상 각각에 포함되는 대상 객체의 우선순위를 설정하여 우선순위 별로 대상 객체를 변경하여 영상 효과에 대한 피드백을 제작자 단말기(110)로부터 수신한다.The image production apparatus 130 performs machine learning by inputting an existing target object provided to each of the plurality of video providing apparatuses 140 as input information. The image production apparatus 130 generates an image in consideration of the location and/or size of the target object included in the plurality of images based on machine learning. The image production apparatus 130 receives feedback on the image effect from the producer terminal 110 by setting the priority of the target object included in each image and changing the target object for each priority.

영상 제작장치(130)는 영상 효과의 차이가 존재하는 영상 간의 차이를 기반으로 우선순위를 결정한다. 영상 제작장치(130)는 외부 영상 영향 정보와 영상과의 관련도를 판단한다. 영상 제작장치(130)는 기존 영상 정보에 포함된 대상 객체(상품)와 직접적으로 관련이 없는 외부 정보를 추출하여 관련도를 결정한다.The image production apparatus 130 determines a priority based on a difference between images in which a difference in image effect exists. The image production apparatus 130 determines the degree of relation between the external image influence information and the image. The image production apparatus 130 determines the degree of relevance by extracting external information that is not directly related to the target object (product) included in the existing image information.

영상 제작장치(130)는 날씨 정보, 지역 온라인 및 오프라인 이벤트 정보 또는 사용자 위치 정보를 포함하는 외부 정보를 생성한다. 영상 제작장치(130)는 기존 영상에 포함되는 날씨 정보, 지역 온라인 및 오프라인 이벤트 정보 또는 사용자 위치 정보에 대한 분석을 기반으로 관련도를 결정한다.The image production apparatus 130 generates external information including weather information, local online and offline event information, or user location information. The image production apparatus 130 determines the degree of relevance based on analysis of weather information included in an existing image, local online and offline event information, or user location information.

영상 제작장치(130)는 기존 영상에 포함된 날씨 정보, 지역 온라인 및 오프라인 이벤트 정보 또는 사용자 위치 정보를 추출하여 날씨, 이벤트, 위치에 대한 분석을 수행한다. 영상 제작장치(130)는 관련도의 크기를 고려하여 관련도가 임계값 이상인 경우, 외부 영상 영향 정보를 고려한 영상을 생성한다.The image production apparatus 130 analyzes weather, events, and locations by extracting weather information, local online and offline event information, or user location information included in an existing image. When the degree of relevance is greater than or equal to a threshold value in consideration of the size of the degree of relevance, the image production apparatus 130 generates an image in consideration of external image influence information.

영상 제작장치(130)는 머신 러닝을 기반으로 영상을 생성한다. 영상 제작장치(130)는 대상 객체에 대한 사람의 시선 관련 정보를 입력 정보로서 수신하여 머신 러닝을 수행한다. 영상 제작장치(130)는 대상 객체에서 사람이 우선적으로 관심을 가지고 보는 객체 우선 인식 영역에 대한 정보 및 대상 객체에서 사람이 순차적으로 관심을 가지고 보는 시선 이동 영역에 대한 정보를 포함한 시선 관련 정보를 생성한다.The image production apparatus 130 generates an image based on machine learning. The image production apparatus 130 performs machine learning by receiving information related to a person's gaze on the target object as input information. The image production apparatus 130 generates gaze-related information including information on an object-priority recognition region that a person preferentially views from a target object and information on a gaze movement region that a person sequentially views with interest in the target object do.

영상 제작장치(130)는 대상 객체 정보, 대상 객체에 대한 시선 정보를 포함하는 제1 시선 데이터 세트를 기반으로 한 기계 학습을 이용하여 객체 우선 인식 영역에 대한 정보를 획득한다. 영상 제작장치(130)는 대상 객체 정보, 대상 객체에 대한 시선 이동 정보를 포함하는 제2 시선 데이터 세트를 기반으로 한 기계 학습을 이용하여 시선 이동 영역에 대한 정보를 획득한다.The image production apparatus 130 obtains information on the object-first recognition region using machine learning based on a first gaze data set including target object information and gaze information on the target object. The image production apparatus 130 obtains information on the gaze movement region by using machine learning based on a second gaze data set including target object information and gaze movement information on the target object.

영상 제작장치(130)는 영상 적합도를 기반으로 제작자에 의해 제공된 상품 이미지의 활용도가 상대적으로 높은 영상(제작자 베이스)을 사용할지 제작자에 의해 제공된 상품 이미지의 활용도가 상대적으로 낮은 영상(인공지능 베이스)을 사용할지 여부를 결정한다. 영상 제작장치(130)는 상품 이미지와 기존 이미지의 유사도를 기반으로 영상 적합도를 결정한다.The image production apparatus 130 determines whether to use an image (producer base) with relatively high utilization of the product image provided by the producer based on the image suitability, or an image with relatively low utilization of the product image provided by the producer (artificial intelligence base) decide whether to use The image production apparatus 130 determines the image suitability based on the similarity between the product image and the existing image.

영상 제작장치(130)는 AI 기반으로 영상 결과를 예측한다. 영상 제작장치(130)는 제1 영상을 생성한다. 영상 제작장치(130)는 제1 영상에 대한 제1 결과 정보를 제작자 단말기(110)로부터 수신한다. 영상 제작장치(130)는 제1 영상과 제1 결과 정보를 입력 정보로 머신 러닝을 수행한다.The image production apparatus 130 predicts an image result based on AI. The image production apparatus 130 generates a first image. The image production apparatus 130 receives first result information on the first image from the producer terminal 110 . The image production apparatus 130 performs machine learning using the first image and the first result information as input information.

영상 제작장치(130)는 머신 러닝을 기반으로 제2 영상을 생성한다. 영상 제작장치(130)는 제2 영상에 대한 제2 결과 정보를 수신한다. 영상 제작장치(130)는 제2 영상과 제2 결과 정보를 입력 정보로 머신 러닝을 수행한다.The image production apparatus 130 generates a second image based on machine learning. The image production apparatus 130 receives second result information on the second image. The image production apparatus 130 performs machine learning using the second image and the second result information as input information.

영상 제작장치(130)는 머신 러닝을 기반으로 영상에 대한 영상 결과 예측을 수행한다. 영상 제작장치(130)는 영상에 따라 생성된 영상 클릭율에 대한 확률 분포 정보를 포함하는 영상 결과 예측을 수행한다.The image production apparatus 130 performs image result prediction on an image based on machine learning. The image production apparatus 130 predicts an image result including probability distribution information on an image click rate generated according to an image.

영상 제작장치(130)는 제1 영상 타겟팅 정보를 포함하는 제1 영상을 생성한다. 영상 제작장치(130)는 제2 영상 타겟팅 정보를 포함하는 제2 영상을 생성한다.The image production apparatus 130 generates a first image including the first image targeting information. The image production apparatus 130 generates a second image including the second image targeting information.

영상 제작장치(130)는 머신 러닝을 기반으로 한 확률 분포 정보를 기반으로 상대적으로 높은 영상 클릭률이 상대적으로 높은 확률로 예측되도록 제1 영상 타겟팅 정보에 포함되는 적어도 하나의 제1 하위 영상 타겟팅 정보의 설정을 변화시켜 제2 영상 타겟팅 정보를 생성한다.The image production apparatus 130 may include at least one first sub-image targeting information included in the first image targeting information such that a relatively high image click-through rate is predicted with a relatively high probability based on probability distribution information based on machine learning. The setting is changed to generate second image targeting information.

영상 제작장치(130)는 확률 분포 정보가 특정 영상 클릭률에 대한 첨도(kurtosis)가 임계값 이상으로 높으며, 특정 영상 클릭률이 상대적으로 높은값을 갖도록 학습한다.The image production apparatus 130 learns that the probability distribution information has a kurtosis with respect to a specific image click-through rate higher than a threshold value and a specific image click-through rate has a relatively high value.

영상 제작장치(130)는 확률 분포 정보를 결정하기 위해 영상 및 영상 타겟팅 정보를 기반으로 머신 러닝을 수행한다. 영상 제작장치(130)는 영상 타겟팅 정보에 포함되는 복수의 하위 영상 타겟팅 정보를 기반으로 형성된 데이터 세트에 대한 클러스터링을 수행하여 임계 거리 데이터 세트를 통해 영상 효과를 예측한다. 영상 제작장치(130)는 영상 효과가 상대적으로 낮은 경우, 복수의 하위 영상 타겟팅 정보의 조합을 변경하여 최대 영상 효과 클러스터를 탐색한다.The image production apparatus 130 performs machine learning based on images and image targeting information to determine probability distribution information. The image production apparatus 130 performs clustering on a data set formed based on a plurality of sub image targeting information included in the image targeting information to predict an image effect through a threshold distance data set. When the image effect is relatively low, the image production apparatus 130 searches for a maximum image effect cluster by changing a combination of a plurality of sub image targeting information.

영상 제작장치(130)는 복수의 하위 영상 타겟팅 정보의 조합을 변경으로 영상 효과가 상대적으로 낮은 경우, 2차적으로 영상 상에서 대상 객체를 분석하고 대상 객체의 우선순위를 설정하여 우선순위 별로 대상 객체를 변경하여 영상 효과에 대한 피드백을 추가적으로 수신한다. 영상 제작장치(130)는 기존에 영상 타겟팅 정보의 설정 값의 범위를 기준으로 영상 효과의 차이를 가진 영상 간의 차이를 기반으로 우선순위를 결정한다.When the image effect is relatively low by changing the combination of a plurality of lower image targeting information, the image production apparatus 130 analyzes the target object on the image and sets the priority of the target object to select the target object by priority. Change it to receive additional feedback on video effects. The image production apparatus 130 determines a priority based on a difference between images having a difference in image effect based on a range of a set value of the image targeting information.

영상 제작장치(130)는 데이터 수집 기술을 기반으로 영상 효과에 영향을 줄 수 있는 외부 영상 영향 정보를 수집한다. 영상 제작장치(130)는 외부 영상 영향 정보와 영상과의 관련도를 결정한다. 영상 제작장치(130)는 관련도의 크기가 임계값 이상인 경우, 외부 영상 영향 정보를 고려하여 영상을 생성한다.The image production apparatus 130 collects external image influence information that may affect image effects based on data collection technology. The image production apparatus 130 determines the degree of relation between the external image influence information and the image. When the magnitude of the degree of relevance is equal to or greater than the threshold value, the image production apparatus 130 generates an image in consideration of external image influence information.

동영상 제공장치(140)는 네트워크(120)를 이용하여 다양한 동영상을 제공하는 장치를 의미한다. 동영상 제공장치(140)(예컨대, 유튜브, 페이스북, 인스타그램, 네이버 TV, 카카오 TV 등)는 입력된 키워드에 대응하는 영상을 자체적인 알고리즘에 의해 출력한다. The video providing device 140 refers to a device that provides various videos using the network 120 . The video providing device 140 (eg, YouTube, Facebook, Instagram, Naver TV, Kakao TV, etc.) outputs an image corresponding to the input keyword by its own algorithm.

도 2는 본 실시예에 따른 영상 제작장치를 개략적으로 나타낸 블럭 구성도이다.2 is a block diagram schematically showing an image production apparatus according to the present embodiment.

본 실시예에 따른 영상 제작장치(130)는 키워드 입력부(210), 레퍼런스 영상 생성부(212), 영상 정보 입력부(220), 맞춤 영상 생성부(222), 객체 분리부(230), 배경음악 분리부(240), 문구 생성부(250), 영상 제작부(260), 영상 데이터 수집부(270), 영상 학습부(280)를 포함한다. 영상 제작장치(130)에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The image production apparatus 130 according to the present embodiment includes a keyword input unit 210 , a reference image generation unit 212 , an image information input unit 220 , a custom image generation unit 222 , an object separation unit 230 , and background music. It includes a separating unit 240 , a phrase generating unit 250 , an image producing unit 260 , an image data collecting unit 270 , and an image learning unit 280 . Components included in the image production apparatus 130 are not necessarily limited thereto.

영상 제작장치(130)에 포함된 각 구성요소는 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작할 수 있다. 이러한 구성요소는 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.Each component included in the image production apparatus 130 may be connected to a communication path that connects a software module or a hardware module inside the device to operate organically with each other. These components communicate using one or more communication buses or signal lines.

도 2에 도시된 영상 제작장치(130)의 각 구성요소는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 소프트웨어적인 모듈, 하드웨어적인 모듈 또는 소프트웨어와 하드웨어의 결합으로 구현될 수 있다.Each component of the image production apparatus 130 shown in FIG. 2 means a unit for processing at least one function or operation, and may be implemented as a software module, a hardware module, or a combination of software and hardware.

키워드 입력부(210)는 제작자 단말기(110)로부터 키워드를 입력받는다. 레퍼런스 영상 생성부(212)는 AI를 이용하여 복수의 동영상 제공장치(140)로부터 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나 이상을 추출하여 레퍼런스 영상을 생성한다.The keyword input unit 210 receives a keyword from the producer terminal 110 . The reference image generator 212 generates a reference image by extracting at least one of a background screen, music, and text corresponding to a keyword from the plurality of video providing devices 140 using AI.

레퍼런스 영상 생성부(212)는 복수의 동영상 제공장치(140)로부터 키워드에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 레퍼런스 영상을 생성한다. 레퍼런스 영상 생성부(212)는 키워드에 대응하는 좋아요, 댓글, 조회수를 기반으로 레퍼런스 영상을 생성한다.The reference image generator 212 generates a reference image by selecting only free data from among the background screen, music, and text corresponding to the keyword from the plurality of video providing devices 140 . The reference image generator 212 generates a reference image based on the number of likes, comments, and views corresponding to keywords.

레퍼런스 영상 생성부(212)는 복수의 동영상 제공장치(140)로부터 기 설정된 기간(최근 5년간)동안 키워드와 가장 높은 연관성을 갖는 영상을 기 설정된 개수를 포함하는 리스트로 출력한다. 레퍼런스 영상 생성부(212)는 리스트에 포함된 영상 중 제작자 선호도를 기반으로 선별된 영상을 레퍼런스 영상으로 생성한다.The reference image generator 212 outputs the images having the highest correlation with the keyword for a preset period (recent five years) from the plurality of video providing apparatuses 140 as a list including a preset number. The reference image generator 212 generates an image selected based on a producer preference among images included in the list as a reference image.

레퍼런스 영상 생성부(212)는 복수의 동영상 제공장치(140)로부터 키워드에 대응하는 영상 중 조회수, 좋아요 횟수, 댓글수, 공유 횟수 중 하나 이상의 정보를 기반으로 1차적으로 높은 연관성을 갖는 영상으로 추출한다.The reference image generating unit 212 is extracted from the plurality of video providing devices 140 as an image having high relevance primarily based on information about one or more of the number of views, the number of likes, the number of comments, and the number of shares among the images corresponding to the keywords from the plurality of video providing devices 140 . do.

레퍼런스 영상 생성부(212)는 복수의 동영상 제공장치(140)로부터 키워드에 대응하는 영상 중 CF(Commercial Film) 수상실적을 갖는 영상을 객관적인 지표로서 데이터를 리스트화시켜 2차적으로 높은 연관성을 갖는 영상으로 추출한다. 레퍼런스 영상 생성부(212)는 1차적으로 높은 연관성을 갖는 영상과 2차적으로 높은 연관성을 갖는 영상을 조합한 후 기 설정된 개수 단위로 리스트화하여 제작자 단말기(110)로 전송한다.The reference image generating unit 212 lists data as an objective indicator of an image having a CF (Commercial Film) award among images corresponding to the keyword from the plurality of moving image providing devices 140, and a secondly high correlation image extracted with The reference image generator 212 combines an image having a primary high correlation with an image having a secondary high correlation, and lists the images in a preset number unit and transmits them to the producer terminal 110 .

레퍼런스 영상 생성부(212)는 리스트에 포함된 영상 중 제작자 단말기(110)가 선택한 영상을 재생시킨다. 레퍼런스 영상 생성부(212)는 재생된 영상의 재생시간, 재생완성률, 재생 구간을 기반으로 제작자 선호도를 산출한다. 레퍼런스 영상 생성부(212)는 리스트에 포함된 영상 중 제작자 선호도에 해당하는 영상을 선별하여 레퍼런스 영상을 생성한다.The reference image generator 212 reproduces an image selected by the producer terminal 110 from among the images included in the list. The reference image generator 212 calculates the producer preference based on the reproduction time, the reproduction completion rate, and the reproduction section of the reproduced image. The reference image generator 212 generates a reference image by selecting an image corresponding to a producer's preference among images included in the list.

레퍼런스 영상 생성부(212)는 제작자 선호도를 기반으로 유사한 영상을 추가로 검색하여 리스트화에 추가한다. 레퍼런스 영상 생성부(212)는 리스트에 포함된 영상 각각의 총 재생시간을 기반으로 재생 구간을 분할한다. 레퍼런스 영상 생성부(212)는 총 재생시간 대비 재생시간을 기반으로 재생 완성률을 확인한다.The reference image generator 212 additionally searches for similar images based on the producer preference and adds them to the list. The reference image generator 212 divides the playback section based on the total playback time of each image included in the list. The reference image generator 212 checks the reproduction completion rate based on the total reproduction time compared to the reproduction time.

레퍼런스 영상 생성부(212)는 리스트에 포함된 영상 각각의 전체 재생구간을 임의의 재생구간(예컨대, 3%, 10%, 25%, 50%, 75%, 100%)으로 분할한다. 레퍼런스 영상 생성부(212)는 임의의 재생구간이 길수록 해당 영상의 카테고리, 속성, 제목이 제작자 선호도에 부합하는 것으로 인지한다.The reference image generator 212 divides the entire playback section of each image included in the list into arbitrary playback sections (eg, 3%, 10%, 25%, 50%, 75%, 100%). The reference image generating unit 212 recognizes that the longer the arbitrary playback section, the more the category, attribute, and title of the corresponding image conform to the producer's preference.

레퍼런스 영상 생성부(212)는 제작자 단말기(110)에 대응하는 제작자 계정에서 기 설정한 카테고리 정보를 영상 화질 카테고리(4K 화질, FHD 화질, HD 화질), 영상 타입 카테고리(홍보영상, 제품영상, 드라마타입, 애니메이션, 인포그래픽, 자연, 인물), 영상 톤 카테고리(역동적인, 화사한, 리드미컬한, 발라드, 드라마타입, 현란한) 중 어느 하나인 것을 확인한다. 레퍼런스The reference image generation unit 212 sets the category information preset in the producer account corresponding to the producer terminal 110 into an image quality category (4K image quality, FHD image quality, HD image quality), an image type category (promotional image, product image, drama). Type, animation, infographic, nature, person), and video tone category (dynamic, bright, rhythmic, ballad, drama type, flashy). reference

영상 생성부(212)는 기 설정한 카테고리에 대응하는 배경화면, 음악, 텍스트에 가중치를 반영하여 레퍼런스 영상을 생성한다. The image generator 212 generates a reference image by reflecting weights on a background screen, music, and text corresponding to a preset category.

영상 정보 입력부(220)는 제작자 단말기(110)로부터 영상 정보를 입력받는다. The image information input unit 220 receives image information from the producer terminal 110 .

맞춤 영상 생성부(222)는 영상 정보를 분석한 분석 결과를 생성한다. 맞춤 영상 생성부(222)는 AI를 이용하여 복수의 동영상 제공장치(140)로부터 분석 결과에 대응하는 데이터를 추출하여 맞춤 영상을 생성한다.The custom image generator 222 generates an analysis result by analyzing image information. The customized image generator 222 generates a customized image by extracting data corresponding to the analysis result from the plurality of video providing devices 140 using AI.

맞춤 영상 생성부(222)는 복수의 동영상 제공장치(140)로부터 분석 결과에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 맞춤 영상을 생성한다. 맞춤 영상 생성부(222)는 영상 정보에 해당하는 제품군을 분석하고, 제품군을 포함하고 있는 영상을 기반으로 맞춤 영상을 생성한다.The customized image generating unit 222 generates a customized image by selecting only free data from among the background screen, music, and text corresponding to the analysis result from the plurality of video providing devices 140 . The custom image generating unit 222 analyzes a product group corresponding to the image information and generates a customized image based on the image including the product group.

맞춤 영상 생성부(222)는 영상 정보로부터 영상 분량(30초), 영상 타입(인포그래픽, 실사 촬영, 인포그래픽 및 실사촬영), 영상 톤(잔잔한, 역동적인, 드라마적인, 색감있는, 아기자기한), 영상 소스(깨끗한 바다, 청량한 느낌, 맑은 자연, 청순한 동양미인, 기초화장품), BGM(맑고 깨끗한 피아노, 맑은 물소리), 문구(‘자연 그대로의 순수함을 머금은 순수한 물결’, ‘오늘부터 자연으로 내 피부에 입히세요’)를 추출한다.The customized image generating unit 222 is configured from the image information to determine the amount of image (30 seconds), image type (infographic, live-action shooting, infographic and photo-realistic shooting), image tone (gentle, dynamic, dramatic, colorful, cute) ), video source (clean sea, refreshing feeling, clear nature, pure oriental beauty, basic cosmetics), BGM (clear and clean piano, clear water sound), phrases ('pure wave with the innocence of nature', 'nature from today') Apply it on my skin').

맞춤 영상 생성부(222)는 영상 소스에 영상 톤, 영상 타입을 적용한 상태에서 BGM, 문구를 삽입하여 영상 분량만큼 재생되도록 하는 맞춤 영상을 생성한다. 맞춤 영상 생성부(222)는 맞춤 영상에 대한 제작자 단말기(110)로부터 수신한 피드백 정보를 수신하여 학습한 학습 결과를 생성한다. 맞춤 영상 생성부(222)는 학습 결과를 맞춤 영상을 생성할 때 반영한다.The customized image generating unit 222 generates a customized image that is reproduced by the amount of the image by inserting BGM and phrases while the image tone and image type are applied to the image source. The customized image generating unit 222 receives feedback information received from the producer terminal 110 for the customized image and generates a learned learning result. The custom image generating unit 222 reflects the learning result when generating the custom image.

맞춤 영상 생성부(222)는 웹소설, 시로부터 문구에 대응하는 긴 문장, 철학적인 문장을 추출하여 맞춤 영상에 삽입한다.The customized image generator 222 extracts a long sentence corresponding to a phrase from a web novel or a poem, and a philosophical sentence and inserts it into the customized image.

객체 분리부(230)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상으로부터 배경 영상과 대상 객체(제품)를 구분한다. 객체 분리부(230)는 레퍼런스 영상과 맞춤 영상 중 대상 객체(제품)를 미포함하는 영상을 배경 영상으로 구분한다. 객체 분리부(230)는 레퍼런스 영상과 맞춤 영상 중 대상 객체(제품)를 포함하는 영상으로부터 대상 객체(제품)만을 분리한다.The object separator 230 separates the background image and the target object (product) from the reference image and the custom image using AI. The object separator 230 divides an image that does not include a target object (product) among the reference image and the custom image as a background image. The object separator 230 separates only the target object (product) from the image including the target object (product) among the reference image and the custom image.

배경음악 분리부(240)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상으로부터 배경 음악만을 추출한다. 문구 생성부(250)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상에 포함된 텍스트를 인지한다. 문구 생성부(250)는 텍스트 중 키워드와 문구와 연관성을 갖는 단어 또는 문장을 추출하여 문구로 재조합한다.The background music separator 240 extracts only the background music from the reference image and the customized image using AI. The phrase generator 250 recognizes text included in the reference image and the custom image using AI. The phrase generating unit 250 extracts words or sentences having a relationship with keywords and phrases from the text and recombines them into phrases.

영상 제작부(260)는 레퍼런스 영상과 맞춤 영상을 조합하여 영상을 제작한다. 영상 제작부(260)는 객체 분리부(230)에 구분한 배경영상 내에 대상 객체를 삽입하는 형태로 영상을 제작한다. 영상 제작부(260)는 배경음악 분리부(240)에서 구분한 배경 음악을 배경영상에 따라 삽입하는 형태로 영상을 제작한다. 영상 제작부(260)는 문구 생성부(250)에서 생성한 문구를 배경영상에 따라 삽입하는 형태로 영상을 제작한다.The image production unit 260 creates an image by combining the reference image and the custom image. The image production unit 260 produces an image in the form of inserting a target object into the background image divided by the object separation unit 230 . The image production unit 260 creates an image in the form of inserting the background music divided by the background music separation unit 240 according to the background image. The image production unit 260 produces an image in the form of inserting the phrase generated by the phrase generation unit 250 according to the background image.

영상 제작부(260)는 제작자 정보에 포함된 타겟 연령층 정보를 기반으로 복수의 대상 객체 정보, 복수의 영상 타겟팅 정보를 포함하는 복수의 영상을 생성한다.The image production unit 260 generates a plurality of images including a plurality of target object information and a plurality of image targeting information based on target age group information included in the producer information.

영상 제작부(260)는 제작자 정보에 포함된 타겟 연령층 정보와 동영상 제공장치(140) 각각의 나이 카테고리를 기반으로 한 클러스터에 의해 결정된 복수의 영상 타겟팅 정보를 생성한다. 영상 제작부(260)는 웹 페이지에 포함된 나이 관련 단어에 대한 단어 집합 추출 빈도 및 단어 밀집도를 기반으로 언어 인접도를 결정한다. 영상 제작부(260)는 언어 인접도에 의해 클러스터의 중심과 타겟 연령층 정보에 포함되는 나이 지시 단어 간의 거리를 결정한다.The image production unit 260 generates target age group information included in the producer information and a plurality of image targeting information determined by a cluster based on each age category of the video providing apparatus 140 . The image production unit 260 determines the language adjacency based on the word set extraction frequency and word density for age-related words included in the web page. The image production unit 260 determines the distance between the center of the cluster and the age-indicating word included in the target age group information based on the language proximity.

영상 제작부(260)는 영상 학습부(280)에서 수행한 제1 머신 러닝을 기반으로 한 제1 영상을 생성한다. 영상 제작부(260)는 영상 학습부(280)에서 수행한 제2 머신 러닝을 기반으로 한 제2 영상을 생성한다. 영상 제작부(260)는 영상 학습부(280)에서 수행한 제3 머신 러닝을 기반으로 한 제3 영상을 생성한다.The image production unit 260 generates a first image based on the first machine learning performed by the image learning unit 280 . The image production unit 260 generates a second image based on the second machine learning performed by the image learning unit 280 . The image production unit 260 generates a third image based on the third machine learning performed by the image learning unit 280 .

영상 제작부(260)는 영상 데이터 수집부(270)로부터 수신한 영상 결과 정보의 분석을 기반으로 영상, 영상 타겟팅 정보에 대한 수정 여부를 결정한다.The image production unit 260 determines whether to correct the image and the image targeting information based on the analysis of the image result information received from the image data collection unit 270 .

영상 제작부(260)는 머신 러닝을 기반으로 레퍼런스 영상 및 맞춤 영상에 포함된 배경 영상에서 분리되는 대상 객체의 위치 또는 크기를 고려하여 복수의 영상을 생성한다.The image producer 260 generates a plurality of images in consideration of the location or size of the target object separated from the background image included in the reference image and the custom image based on machine learning.

영상 제작부(260)는 제작자 정보(미존재)와 관련된 추가적인 질문에 대한 답변을 받지 못하는 경우, 이미 입력받은 제작자 정보(존재)를 기반으로 예측을 수행한다.When the video production unit 260 does not receive an answer to an additional question related to producer information (non-existence), the video production unit 260 performs prediction based on the already input producer information (existence).

영상 제작부(260)는 예측 정확도가 임계값 이상이라고 판단되는 경우, 예측된 정보를 이용하여 복수의 영상을 생성한다. 영상 제작부(260)는 예측 정확도가 임계값 미만이라고 판단되는 경우, 인공 지능 챗봇을 통해 추가 질문을 생성하여 제작자 단말기(110)로 전송한다. 영상 제작부(260)는 제작자 정보(존재)를 기준으로 기존에 입력된 기존 제작자 정보 중 적어도 하나와 비교하여 예측 정확도를 결정한다. 영상 제작부(260)는 제작자 정보(미존재) 별로 예측을 위해 설정된 제작자 정보(존재) 중 특정 제작자 정보(존재) 및 특정 제작자 정보(존재)에 대한 별도의 가중치를 기반으로 예측 정확도를 결정한다.When it is determined that the prediction accuracy is greater than or equal to the threshold value, the image production unit 260 generates a plurality of images by using the predicted information. When it is determined that the prediction accuracy is less than the threshold value, the video production unit 260 generates an additional question through the artificial intelligence chatbot and transmits it to the producer terminal 110 . The image production unit 260 determines the prediction accuracy by comparing the producer information (existence) with at least one of the existing input producer information. The image production unit 260 determines prediction accuracy based on separate weights for specific producer information (existence) and specific producer information (existence) among producer information (existence) set for prediction for each producer information (non-existence).

영상 제작부(260)는 복수의 영상에 포함되는 대상 객체에 대한 우선순위를 설정한다. 영상 제작부(260)는 복수의 영상 중 영상 효과의 차이가 존재하는 영상 간의 차이를 기반으로 우선순위를 결정한다. 영상 제작부(260)는 날씨 정보, 지역 온라인 및 오프라인 이벤트 정보 또는 사용자 위치 정보를 포함하는 외부 영상 영향 정보를 생성한다. 영상 제작부(260)는 외부 영상 영향 정보와 복수의 영상 각각과의 관련도를 판단한다.The image production unit 260 sets priorities for target objects included in a plurality of images. The image production unit 260 determines a priority based on a difference between images having a difference in image effect among a plurality of images. The image production unit 260 generates external image influence information including weather information, local online and offline event information, or user location information. The image production unit 260 determines the degree of relation between the external image influence information and each of the plurality of images.

영상 제작부(260)는 기존 영상 정보에 포함된 상품과 직접적으로 관련이 없는 정보를 추출하여 관련도를 결정한다. 영상 제작부(260)는 기존 영상에 포함되는 날씨 정보, 지역 온라인 및 오프라인 이벤트 정보 또는 사용자 위치 정보에 대한 분석을 기반으로 관련도를 결정한다. 영상 제작부(260)는 관련도의 크기를 고려하여 관련도가 임계값 이상인 경우, 외부 영상 영향 정보를 고려하여 영상을 생성한다.The image production unit 260 determines the degree of relevance by extracting information not directly related to the product included in the existing image information. The image production unit 260 determines the degree of relevance based on analysis of weather information included in the existing image, local online and offline event information, or user location information. When the degree of relevance is greater than or equal to a threshold value in consideration of the size of the degree of relevance, the image production unit 260 generates an image in consideration of external image influence information.

영상 제작부(260)는 레퍼런스 영상과 맞춤 영상을 조합하여 제1 영상, 제2 영상을 생성한다.The image production unit 260 generates a first image and a second image by combining the reference image and the custom image.

영상 제작부(260)는 영상 결과 정보를 머신 러닝한 결과를 기반으로 영상에 대한 영상 결과 예측을 수행한다. 영상 제작부(260)는 영상에 따라 생성된 영상 클릭율에 대한 확률 분포 정보를 포함하는 영상 결과 예측을 생성한다.The image production unit 260 performs image result prediction on the image based on the result of machine learning the image result information. The image production unit 260 generates an image result prediction including probability distribution information for an image click rate generated according to an image.

영상 제작부(260)는 제1 영상 타겟팅 정보를 포함하는 제1 영상 및 제2 영상 타겟팅 정보를 포함하는 제2 영상을 생성한다. 영상 제작부(260)는 머신 러닝을 기반으로 한 확률 분포 정보를 기반으로 상대적으로 높은 영상 클릭률이 상대적으로 높은 확률로 예측되도록 제1 영상 타겟팅 정보에 포함되는 적어도 하나의 제1 하위 플랫폼 영상 타겟팅 정보의 설정을 변화시켜 제2 영상 타겟팅 정보를 생성한다.The image production unit 260 generates a first image including the first image targeting information and a second image including the second image targeting information. The image production unit 260 includes at least one first lower platform image targeting information included in the first image targeting information so that a relatively high image click-through rate is predicted with a relatively high probability based on probability distribution information based on machine learning. The setting is changed to generate second image targeting information.

영상 제작부(260)는 영상 타겟팅 정보에 포함되는 복수의 하위 영상 타겟팅 정보를 기반으로 형성된 데이터 세트에 대한 클러스터링을 수행하여 임계 거리 데이터 세트를 통해 영상 효과를 예측한다. 영상 제작부(260)는 영상 효과가 상대적으로 낮은 경우, 복수의 하위 영상 타겟팅 정보의 조합을 변경하여 최대 영상 효과 클러스터를 탐색한다.The image producer 260 predicts an image effect through a threshold distance data set by performing clustering on a data set formed based on a plurality of sub image targeting information included in the image targeting information. When the image effect is relatively low, the image production unit 260 searches for a maximum image effect cluster by changing a combination of a plurality of sub image targeting information.

영상 제작부(260)는 복수의 하위 영상 타겟팅 정보의 조합을 변경으로 영상 효과가 상대적으로 낮은 경우, 2차적으로 영상 상에서 대상 객체를 분석하고 대상 객체의 우선순위를 설정하여 우선순위 별로 대상 객체를 변경하여 영상 효과에 대한 피드백을 추가적으로 수신하도록 한다. 영상 제작부(260)는 기존에 영상 타겟팅 정보의 설정 값의 범위를 기준으로 영상 효과의 차이를 가진 영상 간의 차이를 기반으로 우선순위를 결정한다.When the image effect is relatively low by changing the combination of a plurality of sub-image targeting information, the image production unit 260 secondaryly analyzes the target object on the image and sets the priority of the target object to change the target object for each priority In this way, feedback on the video effect is additionally received. The image production unit 260 determines a priority based on a difference between images having a difference in image effect based on a range of a set value of the image targeting information.

영상 제작부(260)는 외부 영상 영향 정보와 영상과의 관련도를 결정하며, 관련도의 크기가 임계값 이상인 경우, 외부 영상 영향 정보를 고려하여 복수의 영상을 생성하도록 한다.The image production unit 260 determines the degree of relevance between the external image influence information and the image, and when the magnitude of the relation is equal to or greater than a threshold value, generates a plurality of images in consideration of the external image influence information.

영상 데이터 수집부(270)는 제작자 단말기(110)로부터 타겟 연령층 정보를 포함하는 제작자 정보를 수신한다. 영상 데이터 수집부(270)는 영상 제작부(260)에서 생성한 제1 영상, 제2 영상 및 제3 영상에 대한 제작자 단말기(110)의 선택 결과를 수집한다. 영상 데이터 수집부(270)는 영상 제작부(260)에서 생성한 영상에 대한 영상 결과 정보를 제작자 단말기(110)로부터 수신한다.The image data collection unit 270 receives producer information including target age group information from the producer terminal 110 . The image data collection unit 270 collects selection results of the producer terminal 110 for the first image, the second image, and the third image generated by the image production unit 260 . The image data collection unit 270 receives image result information on the image generated by the image production unit 260 from the producer terminal 110 .

영상 데이터 수집부(270)는 인공 지능 챗봇 상에 입력된 제작자 웹 페이지 상의 정보의 스크랩핑, 인공 지능 챗봇을 이용하여 제작자 단말기(110)로의 질의를 전송하고, 질의에 대한 답변을 기반으로 제작자 정보를 수집한다.The image data collection unit 270 transmits a query to the producer terminal 110 using the scraping of information on the producer web page input on the artificial intelligence chatbot, the artificial intelligence chatbot, and producer information based on the answer to the query. to collect

영상 데이터 수집부(270)는 우선순위 별로 대상 객체를 변경하여 영상 효과에 대한 피드백을 제작자 단말기(110)로부터 수신한다. 영상 데이터 수집부(270)는 영상 제작부(260)에서 생성한 제1 영상에 대한 제1 결과 정보, 제2 영상에 대한 제2 결과 정보를 제작자 단말기(110)로부터 수신한다. 영상 데이터 수집부(270)는 데이터 수집 기술을 기반으로 영상 효과에 영향을 줄 수 있는 외부 영상 영향 정보를 수집한다.The image data collection unit 270 receives feedback on the image effect from the producer terminal 110 by changing the target object by priority. The image data collection unit 270 receives the first result information on the first image and the second result information on the second image generated by the image production unit 260 from the producer terminal 110 . The image data collection unit 270 collects external image influence information that may affect image effects based on data collection technology.

영상 학습부(280)는 제1 머신 러닝부, 제2 머신 러닝부, 제3 머신 러닝부를 포함한다. 제1 머신 러닝부는 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려하지 않은 학습 데이터를 기반으로 한 제1 머신 러닝을 수행한다. 제2 머신 러닝부는 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려한 학습 데이터를 기반으로 한 제2 머신 러닝을 수행한다. 제3 머신 러닝부는 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려하지 않은 학습 데이터 및 동영상 제공장치(140)에 대한 멀티 플랫폼을 고려한 학습 데이터를 기반으로 한 제3 머신 러닝을 수행한다.The image learning unit 280 includes a first machine learning unit, a second machine learning unit, and a third machine learning unit. The first machine learning unit performs first machine learning based on the learning data that does not consider the multi-platform for the video providing device 140 . The second machine learning unit performs second machine learning based on the learning data in consideration of the multi-platform for the video providing device 140 . The third machine learning unit performs third machine learning based on training data that does not consider multi-platform for the video providing device 140 and learning data considering multi-platform for the video providing device 140 .

영상 학습부(280)는 영상 학습부(280)에서 수행한 제3 머신 러닝을 위한 플랫폼을 고려하지 않은 학습 데이터 및 플랫폼을 고려한 학습 데이터의 비율을 변화시킨다. 영상 학습부(280)는 레퍼런스 영상 및 맞춤 영상에 포함된 대상 객체를 입력 정보로서 입력하여 머신 러닝을 수행한다.The image learning unit 280 changes the ratio of the learning data that does not consider the platform for the third machine learning performed by the image learning unit 280 and the learning data that considers the platform. The image learning unit 280 performs machine learning by inputting target objects included in the reference image and the custom image as input information.

영상 학습부(280)는 영상에 포함된 대상 객체에 대한 사람의 시선 관련 정보를 입력 정보로서 수신하여 머신 러닝을 수행한다. 영상 학습부(280)는 영상에 포함된 대상 객체에 대해 사람이 우선적으로 관심을 가지고 보는 객체 우선 인식 영역에 대한 정보 및 대상 객체에서 사람이 순차적으로 관심을 가지고 보는 시선 이동 영역에 대한 정보를 포함한 시선 관련 정보를 생성한다.The image learning unit 280 performs machine learning by receiving, as input information, information related to a human gaze on a target object included in an image. The image learning unit 280 includes information on an object-priority recognition region that a person preferentially views with interest in a target object included in the image, and information on a gaze movement region that a person sequentially views with interest in the target object. Generates gaze-related information.

영상 학습부(280)는 영상에 포함된 대상 객체 정보, 대상 객체에 대한 시선 정보를 포함하는 제1 시선 데이터 세트를 기반으로 한 기계 학습을 이용하여 객체 우선 인식 영역에 대한 정보를 획득한다. 영상 학습부(280)는 영상에 포함된 대상 객체 정보, 대상 객체에 대한 시선 이동 정보를 포함하는 제2 시선 데이터 세트를 기반으로 한 기계 학습을 이용하여 시선 이동 영역에 대한 정보를 획득한다.The image learning unit 280 obtains information on the object-first recognition region by using machine learning based on a first gaze data set including target object information included in the image and gaze information on the target object. The image learning unit 280 obtains information on the gaze movement region by using machine learning based on a second gaze data set including target object information included in the image and gaze movement information on the target object.

영상 학습부(280)는 대상 객체와 기존 대상 객체의 유사도를 기반으로 결정한 영상 적합도를 기반으로 제작자에 의해 제공된 상품 이미지의 활용도가 상대적으로 높은 플랫폼 영상(제작자 베이스)을 사용할지 제작자에 의해 제공된 상품 이미지의 활용도가 상대적으로 낮은 플랫폼 영상은 플랫폼 영상(인공지능 베이스)을 사용할지 여부를 결정한다.The image learning unit 280 determines whether to use a platform image (producer base) with relatively high utilization of the product image provided by the producer based on the image fit determined based on the similarity between the target object and the existing target object, or whether to use the product provided by the producer. Platform images with relatively low utilization of images determine whether to use platform images (AI base).

영상 학습부(280)는 제1 영상, 제1 결과 정보, 제2 영상, 제2 결과 정보를 입력 정보로 머신 러닝을 수행한다.The image learning unit 280 performs machine learning using the first image, the first result information, the second image, and the second result information as input information.

영상 학습부(280)는 확률 분포 정보가 특정 영상 클릭률에 대한 첨도(kurtosis)가 임계값 이상으로 높으며, 특정 영상 클릭률이 상대적으로 높은값을 갖도록 학습한다. 영상 학습부(280)는 확률 분포 정보를 결정하기 위해 플랫폼 영상 및 플랫폼 영상 타겟팅 정보를 기반으로 머신 러닝을 수행한다.The image learning unit 280 learns the probability distribution information so that the kurtosis for a specific image click-through rate is higher than a threshold value and the specific image click-through rate has a relatively high value. The image learning unit 280 performs machine learning based on a platform image and platform image targeting information to determine probability distribution information.

도 3은 본 실시예에 따른 AI 기반의 영상 제작 방법을 설명하기 위한 순서도이다.3 is a flowchart illustrating an AI-based image production method according to the present embodiment.

영상 제작장치(130)는 제작자 단말기(110)로부터 키워드를 입력받는다(S310). 영상 제작장치(130)는 AI를 이용하여 복수의 동영상 제공장치(140)로부터 키워드에 대응하는 배경화면, 음악, 텍스트 중 적어도 하나 이상을 추출하여 레퍼런스 영상을 생성한다(S320). The video production apparatus 130 receives a keyword from the producer terminal 110 (S310). The image production apparatus 130 generates a reference image by extracting at least one of a background screen, music, and text corresponding to a keyword from the plurality of video providing apparatuses 140 using AI (S320).

단계 S320에서, 영상 제작장치(130)는 제작자가 제작하고자 하는 영상의 레퍼런스 영상 검색하고 소개한다. 영상 제작장치(130)는 제작자가 만들고자 하는 예시 영상들의 레퍼런스들을 최적화시킨다. 영상 제작장치(130)는 제작자 단말기(110)로부터 ‘뷰티화장품’이란 키워드를 입력받으면, 기 제작된 화장품에 관련된 광고, 홍보 등의 영상들이 좋아요, 댓글, 조회수 등 신뢰할 수 있는 데이터로 정렬되어 TOP 100을 선별하여 제작자 단말기(110)로 출력한다.In step S320 , the image production apparatus 130 searches for and introduces a reference image of an image that the producer wants to produce. The image production apparatus 130 optimizes references of example images that the producer intends to create. When the video production device 130 receives the keyword 'beauty cosmetics' from the producer terminal 110, images such as advertisements and promotions related to pre-made cosmetics are sorted into reliable data such as likes, comments, and views, and TOP 100 is selected and output to the manufacturer terminal 110 .

영상 제작장치(130)는 제작자 단말기(110)로부터 제작자가 마음에 드는 영상들을 선택하면, AI를 이용하여 선택된 영상들의 공통점을 파악하여, 다시 제작자 단말기(110)로 전송한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 몇 번의 과정을 거쳐 제작자가 만들고자 하는 예시 영상 레퍼런스를 최적화한다. 영상 제작장치(130)는 예시 영상 레퍼런스를 최적화하는 과정에서 AI를 학습시켜서, 비슷한 성향을 가진 타사용자에게 예시 영상 레퍼런스를 소개하여 데이터를 축적한다. When the producer selects images he likes from the producer terminal 110 , the image production apparatus 130 uses AI to identify a common point of the selected images and transmits the images to the producer terminal 110 again. The image production apparatus 130 optimizes an example image reference that the producer wants to make through several processes from the producer terminal 110 . The image production apparatus 130 learns AI in the process of optimizing the example image reference, and accumulates data by introducing the example image reference to other users with similar tendencies.

영상 제작장치(130)는 제작자 단말기(110)로부터 영상 정보를 입력받는다(S330). 영상 제작장치(130)는 영상 정보를 분석한 분석 결과를 생성하고, AI를 이용하여 복수의 동영상 제공장치(140)로부터 분석 결과에 대응하는 데이터를 추출하여 맞춤 영상을 생성한다(S340).The image production apparatus 130 receives image information from the producer terminal 110 (S330). The image production apparatus 130 generates an analysis result by analyzing the image information, and extracts data corresponding to the analysis result from the plurality of video providing apparatuses 140 using AI to generate a customized image (S340).

단계 S340에서, 영상 제작장치(130)는 제작자가 만들고자 하는 영상의 필요정보를 입력하면, 머신러닝으로 학습된 AI 알고리즘에 의해 알맞은 영상 데이터를 매칭시켜가면서, AI 영상을 쉽고 빠르게 제작한다. In step S340, the image production device 130, when the producer inputs the necessary information of the image to be made, matches the appropriate image data by the AI algorithm learned by machine learning, and quickly and easily produces the AI image.

예컨대, 영상 제작장치(130)는 제작자 단말기(110)로부터 원하는 영상 정보를 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 제작분량으로 30초, 45초, 60초, 2분, 5분, 10분 중 하나를 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 영상 타입으로 인포그래픽, 실사영상 데이터, 인포그래픽과 실사영상 데이터 중 하나를 입력받는다. For example, the image production apparatus 130 receives desired image information from the producer terminal 110 . The video production apparatus 130 receives one of 30 seconds, 45 seconds, 60 seconds, 2 minutes, 5 minutes, and 10 minutes as the production amount from the producer terminal 110 . The image production apparatus 130 receives one of infographics, live-action image data, infographics and live-action image data as an image type from the producer terminal 110 .

영상 제작장치(130)는 제작자 단말기(110)로부터 영상 톤으로 잔잔한 톤, 역동적인 톤, 드라마타입 톤, 트랜디한 톤, 감성적인 톤 중 하나를 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 영상소스로 인포그래픽인 경우 여러 개의 예시 영상소스를 입력받고, 실사촬영인 경우 예시 실사영상을 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 원하는 영상 속도로 잔잔하게, 보통, 빠르게 중 하나를 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 BGM을 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 영상 자막을 사용자가 넣고 싶은 영상자막을 입력받는다. 영상 제작장치(130)는 제작자 단말기(110)로부터 로고로 첨부파일을 삽입받고 첨부 파일 내용을 영상 처음 또는 끝에 노출할지 선택받는다.The video production apparatus 130 receives one of a calm tone, a dynamic tone, a drama type tone, a trendy tone, and an emotional tone as an image tone from the producer terminal 110 . The image production apparatus 130 receives multiple example image sources as an image source from the producer terminal 110 in the case of infographics, and receives an example live-action image in the case of live-action shooting. The image production apparatus 130 receives from the producer terminal 110 one of calm, normal, and fast at a desired image speed. The video production apparatus 130 receives the BGM input from the producer terminal 110 . The video production apparatus 130 receives the video caption that the user wants to put the video caption from from the producer terminal 110 . The video production apparatus 130 receives an attachment as a logo from the producer terminal 110 and selects whether to expose the attachment file at the beginning or the end of the video.

단계 S340 이후 영상 제작장치(130)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상으로부터 배경 영상과 대상 객체(제품)를 구분한다. 영상 제작장치(130)는 레퍼런스 영상과 맞춤 영상 중 대상 객체(제품)를 미포함하는 영상을 배경 영상으로 구분한다. 영상 제작장치(130)는 레퍼런스 영상과 맞춤 영상 중 대상 객체(제품)를 포함하는 영상으로부터 대상 객체(제품)만을 분리한다. 영상 제작장치(130)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상으로부터 배경 음악만을 추출한다. 영상 제작장치(130)는 AI를 이용하여 레퍼런스 영상과 맞춤 영상에 포함된 텍스트를 인지한다. 영상 제작장치(130)는 텍스트 중 키워드와 문구와 연관성을 갖는 단어 또는 문장을 추출하여 문구로 재조합한다.After step S340, the image production apparatus 130 uses AI to distinguish a background image and a target object (product) from the reference image and the custom image. The image production apparatus 130 classifies an image that does not include a target object (product) among the reference image and the custom image as a background image. The image production apparatus 130 separates only the target object (product) from the image including the target object (product) among the reference image and the custom image. The image production apparatus 130 extracts only the background music from the reference image and the customized image using AI. The image production apparatus 130 recognizes text included in the reference image and the custom image by using AI. The image production apparatus 130 extracts words or sentences having a relationship with keywords and phrases from among texts and recombines them into phrases.

영상 제작장치(130)는 레퍼런스 영상과 맞춤 영상을 조합하여 영상을 제작한다(S350). 단계 S350에서, 영상 제작장치(130)는 배경영상 내에 대상 객체를 삽입하는 형태로 영상을 제작한다. 영상 제작장치(130)는 배경 음악을 배경영상에 따라 삽입하는 형태로 영상을 제작한다. 영상 제작장치(130)는 문구를 배경영상에 따라 삽입하는 형태로 영상을 제작한다.The image production apparatus 130 produces an image by combining the reference image and the custom image (S350). In step S350, the image production apparatus 130 creates an image in the form of inserting a target object in the background image. The image production apparatus 130 produces an image in the form of inserting background music according to the background image. The image production apparatus 130 produces an image in the form of inserting a text according to the background image.

영상 제작장치(130)는 영상제작이 완료된 후, 수정구간을 사용자가 직접 선택하게 하여, 재제작이 가능하도록 하여 몇 번의 과정을 거쳐 사용자가 만들고자 하는 영상을 제작할 수 있도록 한다. 영상 제작장치(130)는 AI를 학습시켜서 비슷한 영상을 만들고자 하는 타사용자에게 접목시켜 AI 기반 영상을 제작한다.After the image production is completed, the image production apparatus 130 allows the user to directly select a correction section to enable re-production, so that the image the user wants to make can be produced through several processes. The video production device 130 creates AI-based video by learning AI and grafting it to other users who want to make a similar video.

도 3에서는 단계 S310 내지 단계 S350을 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 3에 기재된 단계를 변경하여 실행하거나 하나 이상의 단계를 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 3은 시계열적인 순서로 한정되는 것은 아니다.Although it is described that steps S310 to S350 are sequentially executed in FIG. 3 , it is not necessarily limited thereto. In other words, since it may be applicable to changing and executing the steps described in FIG. 3 or executing one or more steps in parallel, FIG. 3 is not limited to a chronological order.

전술한 바와 같이 도 3에 기재된 본 실시예에 따른 AI 기반의 영상 제작 방법은 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 본 실시예에 따른 AI 기반의 영상 제작 방법을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. As described above, the AI-based image production method according to the present embodiment described in FIG. 3 may be implemented as a program and recorded in a computer-readable recording medium. A computer-readable recording medium in which a program for implementing the AI-based image production method according to the present embodiment is recorded includes all types of recording devices in which data readable by a computer system is stored.

도 4는 본 실시예에 따른 복수의 영상을 제작하는 방법을 나타낸 도면이다.4 is a diagram illustrating a method of producing a plurality of images according to the present embodiment.

영상 제작장치(130)는 제작자 정보를 기반으로 복수의 영상을 제작한다. 영상 제작장치(130)는 제작자 정보를 기반으로 복수의 동영상 제공장치(140) 각각에 대한 영상을 제작한다.The image production apparatus 130 produces a plurality of images based on producer information. The image production apparatus 130 creates an image for each of the plurality of video providing apparatuses 140 based on producer information.

영상 제작장치(130)는 제작자 단말기(110)로부터 제작자 정보를 수신한다. 영상 제작장치(130)는 제작자 정보에 포함된 이미지 정보, 회사 상표 정보, 카피 문구 정보 중 하나 이상의 정보를 추출한다. 영상 제작장치(130)는 이미지 정보, 회사 상표 정보, 카피 문구 정보 중 하나 이상의 정보를 기반으로 영상을 제작한다.The video production apparatus 130 receives producer information from the producer terminal 110 . The video production apparatus 130 extracts at least one of image information, company trademark information, and copy phrase information included in the producer information. The image production apparatus 130 creates an image based on one or more of image information, company trademark information, and copy phrase information.

영상 제작장치(130)는 복수의 동영상 제공장치(140)별로 서로 다른 영상을 제작한다. 예컨대, 영상 제작장치(130)는 제1 동영상 제공장치(예컨대, 트위터)와 제2 동영상 제공장치(예컨대, 유튜브)에 대해 서로 다른 영상을 제작할 수 있다.The image production apparatus 130 produces different images for each of the plurality of video providing apparatuses 140 . For example, the video production apparatus 130 may produce different images for the first video providing device (eg, Twitter) and the second video providing device (eg, YouTube).

영상 제작장치(130)는 영상 데이터 수집부(270), 데이터 가공부, 영상 학습부(280)를 포함한다. 영상 학습부(280)는 제1 머신 러닝부, 제2 머신 러닝부, 제3 머신 러닝부를 포함한다.The image production apparatus 130 includes an image data collection unit 270 , a data processing unit, and an image learning unit 280 . The image learning unit 280 includes a first machine learning unit, a second machine learning unit, and a third machine learning unit.

제1 머신 러닝부는 플랫폼별 구분이 없이 기존 영상의 수집, 가공, 학습을 수행하는 제1 머신 러닝을 수행한다. 제2 머신 러닝부는 멀티 플랫폼을 구분하여 멀티 플랫폼별 영상에 대한 수집, 가공, 학습을 수행하는 제2 머신 러닝을 수행한다. 제3 머신 러닝부는 서로 다른 학습 데이터 세트(예컨대, 상품별로 구분된 기존 상품 이미지, 동영상 제공장치별 제품 이미지)을 이용한 제3 머신 러닝을 수행한다.The first machine learning unit performs first machine learning to collect, process, and learn existing images without distinction by platform. The second machine learning unit performs second machine learning by classifying multi-platforms to collect, process, and learn images for each multi-platform. The third machine learning unit performs third machine learning using different learning data sets (eg, an existing product image classified for each product and a product image for each video providing device).

제1 머신 러닝부와 제2 머신 러닝부는 지도 학습, 비지도 학습, 딥 러닝을 포함을 이용하여 제1 머신 러닝, 제2 머신 러닝을 수행한다. The first machine learning unit and the second machine learning unit perform the first machine learning and the second machine learning using supervised learning, unsupervised learning, and deep learning.

제1 머신 러닝부는 지도 학습을 위한 라벨링을 수행되는 경우, 기존 대상 객체에 포함된 상품의 위치, 보조 객체의 위치, 회사 상표의 위치, 카피 문구에 대한 위치에 대한 라벨링된 데이터를 제1 머신 러닝을 위해 입력되는 학습 데이터로서 입력받아 제1 머신 러닝을 수행한다. When labeling for supervised learning is performed, the first machine learning unit performs first machine learning of labeled data for the position of the product included in the existing target object, the position of the auxiliary object, the position of the company trademark, and the position for the copy phrase. The first machine learning is performed by receiving the input as learning data input for

제2 머신 러닝부는 라벨링된 플랫폼별 기존 대상 객체를 제2 머신 러닝을 위해 입력되는 학습 데이터로서 입력받아 제2 머신 러닝을 수행한다. 제2 머신 러닝부는 플랫폼 별 기존 대상 객체에 포함된 상품의 위치, 보조 객체의 위치, 회사 상표의 위치, 카피 문구에 대한 위치에 대한 라벨링된 데이터를 제2 머신 러닝을 위해 입력되는 학습 데이터로서 입력받아 제2 머신 러닝을 수행한다.The second machine learning unit receives an existing target object for each labeled platform as the learning data input for the second machine learning and performs second machine learning. The second machine learning unit inputs the labeled data for the position of the product included in the existing target object for each platform, the position of the auxiliary object, the position of the company trademark, and the position for the copy phrase as learning data input for the second machine learning and perform second machine learning.

영상 제작장치(130)는 제1 머신 러닝부에서 수행하는 제1 머신 러닝과 제2 머신 러닝부에서 수행하는 제2 머신 러닝을 기반으로 플랫폼별 영상을 각각 생성할 수 있다. The image production apparatus 130 may generate images for each platform based on the first machine learning performed by the first machine learning unit and the second machine learning performed by the second machine learning unit, respectively.

영상 제작장치(130)는 제1 머신 러닝부에서 수행하는 제1 머신 러닝과 제2 머신 러닝부에서 수행하는 제2 머신 러닝을 합쳐져 하나의 영상을 생성할 수 있다.The image production apparatus 130 may generate one image by combining the first machine learning performed by the first machine learning unit and the second machine learning performed by the second machine learning unit.

영상 제작장치(130)는 제1 머신 러닝부에서 수행하는 제1 머신 러닝을 기반으로 제1 영상을 제작한다. 영상 제작장치(130)는 제2 머신 러닝부에서 수행하는 제2 머신 러닝을 기반으로 제2 영상을 제작한다. 영상 제작장치(130)는 제3 머신 러닝부에서 수행하는 제3 머신 러닝을 기반으로 제3 영상을 제작한다.The image production apparatus 130 produces a first image based on the first machine learning performed by the first machine learning unit. The image production apparatus 130 produces a second image based on the second machine learning performed by the second machine learning unit. The image production apparatus 130 produces a third image based on the third machine learning performed by the third machine learning unit.

영상 제작장치(130)는 제1 영상, 제2 영상, 제3 영상을 제작자 단말기(110)로 전송한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 제1 영상, 제2 영상, 제3 영상 중 하나를 선택받을 수 있다.The image production apparatus 130 transmits the first image, the second image, and the third image to the producer terminal 110 . The image production apparatus 130 may receive one of the first image, the second image, and the third image selected from the producer terminal 110 .

영상 제작장치(130)는 머신 러닝을 이용하여 학습한 AI을 기반으로 동영상 제공장치(140)별 영상을 제작하여 동영상 제공장치(140)별 성향에 맞는 영상을 제작한다. 예컨대, 영상 제작장치(130)는 AI을 기반으로 상품의 위치/크기, 회사 상표의 위치/크기, 카피 문구의 위치/크기, 배경, 글씨 폰트, 이미지의 해상도 및 크기 등이 결정하여 동영상 제공장치(140)로 영상을 상이하게 제작할 수 있다.The image production device 130 produces an image for each video providing device 140 based on the AI learned using machine learning, thereby producing an image suitable for each video providing device 140 . For example, the video production device 130 determines the location/size of the product, the location/size of the company trademark, the location/size of the copy text, the background, the font of the text, and the resolution and size of the image based on the AI to provide a video providing device The image may be produced differently with 140 .

영상 데이터 수집부(270)는 기존 영상에 대해 수집할 때, 영상 효과에 대한 정보도 함께 수집한다. 영상 데이터 수집부(270)는 동영상 제공장치(140)에서 영상 반응 정보('좋아요'의 개수, 댓글의 개수, 영상 클릭률 등)를 기반으로 영상 효과도 함께 수집하여 기존 제품 이미지와 영상 효과에 대한 기계 학습을 수행한다. When the image data collection unit 270 collects the existing image, it also collects information about the image effect. The image data collection unit 270 also collects image effects based on the image response information (the number of 'likes', the number of comments, the click-through rate of the image, etc.) from the video providing device 140, do machine learning.

영상 데이터 수집부(270)는 복수의 머신 러닝 결과 각각을 기반으로 한 영상 각각에 대한 제작자 장치의 선택 결과를 수집하여 학습 패턴을 변화시킬 수 있다.The image data collection unit 270 may change a learning pattern by collecting a selection result of a producer device for each image based on each of a plurality of machine learning results.

제3 머신 러닝부는 제1 영상, 제2 영상, 제3 영상 중 제2 영상의 선택 비율이 다른 제1 영상과 제3 영상의 선택 비율과 비교하여 설정된 임계 비율을 넘어가는 경우, 제2 영상의 학습을 위해 사용되었던 입력 데이터의 비율을 상대적으로 높여서 제3 머신 러닝을 수행할 수 있다.When the selection ratio of the second image among the first image, the second image, and the third image exceeds a threshold ratio set by comparing the selection ratio of the other first image and the third image, the third machine learning unit selects the second image. The third machine learning may be performed by relatively increasing the ratio of input data used for learning.

영상 제작장치(130)는 서로 다른 영상의 선택 비율과 비교하여 특정 영상의 선택 비율이 설정된 임계 비율을 넘어가는 경우, 제작자 단말기(110)로부터 별도의 선택 절차 없이 선택 비율이 높은 영상만을 제공할 수 있다.The image production apparatus 130 may provide only an image having a high selection ratio without a separate selection procedure from the producer terminal 110 when the selection ratio of a specific image exceeds a set threshold ratio compared to the selection ratio of different images. have.

도 5는 본 실시예에 따른 영상 결과에 따라 영상 타겟팅 방법을 나타낸 도면 이다.5 is a diagram illustrating an image targeting method according to an image result according to the present embodiment.

영상 제작장치(130)는 영상을 제작하여 동영상 제공 장치(140)에 등록한다. 이후, 영상 제작장치(130)는 동영상 제공 장치(140)로부터 영상에 대한 영상 결과 정보를 수신한다. 영상 제작장치(130)는 자체적으로 영상 결과 정보를 머신 러닝 결과에 대한 피드백으로 이용한다.The image production apparatus 130 creates an image and registers it in the video providing apparatus 140 . Thereafter, the image production apparatus 130 receives image result information on the image from the video providing apparatus 140 . The image production device 130 itself uses the image result information as feedback for the machine learning result.

영상 제작장치(130)는 특정 영상에 대한 영상 결과 정보(예를 들어, 영상 클릭률, 좋아요 수, 댓글 수 등)을 수집한다.The image production apparatus 130 collects image result information (eg, image click-through rate, number of likes, number of comments, etc.) for a specific image.

영상 제작장치(130)는 영상과 영상 결과 정보를 매칭하여 영상 학습부(280)로 입력한다. 영상 학습부(280)는 효과적인 영상 효과를 가지는 영상에 대한 머신 러닝을 수행한다.The image production apparatus 130 matches the image with the image result information and inputs it to the image learning unit 280 . The image learning unit 280 performs machine learning on an image having an effective image effect.

영상 제작장치(130)는 영상 결과 정보를 반영하여 영상에 포함되는 영상 디자인을 변화시킬 수 있다. 예컨대, 영상 제작장치(130)는 제1 영상에서 상품 이미지가 크고 카피 문구는 상대적으로 작을수록 영상 클릭률이 높고, 제2 영상에서 상품 이미지가 작고 카피 문구는 상대적으로 클수록 영상 클릭률이 높은 것으로 확인하면, 영상 결과 정보를 반영하여 영상 내 포함되는 상품 이미지, 문구의 디자인 방식을 변화시킬 수 있다.The image production apparatus 130 may change the image design included in the image by reflecting the image result information. For example, if the image production device 130 confirms that the larger the product image in the first image and the smaller the copy phrase, the higher the video click-through rate, and the smaller the product image in the second image and the larger the copy phrase, the higher the video click-through rate. , it is possible to change the design method of product images and phrases included in the video by reflecting the video result information.

영상 제작장치(130)는 대상 객체 또는 영상 결과 정보에 대한 데이터 세트를 입력으로 한 머신 러닝을 수행할 수 있다. 영상 제작장치(130)는 머신 러닝 결과를 기반으로 이후 제작자 정보를 기반으로 영상을 제작할 때, 대상 객체, 상품 이미지, 로고, 카피 문구 등의 위치를 결정할 수 있다.The image production apparatus 130 may perform machine learning by inputting a data set for a target object or image result information. The image production apparatus 130 may determine the location of a target object, a product image, a logo, a copy phrase, and the like, when an image is produced based on the producer information later based on the machine learning result.

영상 제작장치(130)는 피드백 결과를 기반으로 영상 제작 예산 분배 결정 및/또는 영상 배포 기간 결정할 수 있다. 영상 제작장치(130)는 영상 제작으로 사용할 수 있는 금액이 기 설정된 금액(예컨대, 100만원)인 경우, 기 설정된 금액(예컨대, 100만원)으로 특정 동영상 제공장치에 특정 플랫폼을 타겟팅하여 설정하고, 특정 기간동안 특정 영상이 배포될 동안 얼마큼 효과적인지를 분석한 분석 결과를 생성한다.The image production apparatus 130 may determine an image production budget distribution decision and/or an image distribution period based on the feedback result. When the amount that can be used for video production is a preset amount (eg, 1 million won), the video production device 130 targets and sets a specific platform to a specific video providing device with a preset amount (for example, 1 million won), Generates an analysis result that analyzes how effective a specific video is during distribution for a specific period.

영상 제작장치(130)는 영상 타겟팅 설정에 따른 기존 동일/유사한 물품/서비스의 영상 효과를 동영상 제공장치(140) 별로 분석한다. 영상 제작장치(130)는 소분류(화장품), 중분류(미용 용품), 대분류(생활 용품) 등과 같은 물품 분류를 기반으로 광고할 제품의 동일 또는 유사 여부를 결정한다.The image production apparatus 130 analyzes the image effect of the existing same/similar goods/services according to the image targeting setting for each video providing apparatus 140 . The image production apparatus 130 determines whether the products to be advertised are identical or similar based on the product classification, such as a small category (cosmetics), a medium category (beauty products), and a large category (living goods).

영상 제작장치(130)는 쇼핑 카테고리에 대한 AI 기반의 학습으로 광고할 제품의 동일 또는 유사 여부를 결정한다. 영상 제작장치(130)는 영상 효과가 높은 것으로 판단되는 기존 동일/유사한 물품/서비스에서 설정된 동영상 제공장치(140)별 영상 제작 금액의 비율 정보, 영상 배포 기간 정보, 플랫폼 영상 타겟팅 정보를 추출한다.The video production apparatus 130 determines whether the product to be advertised is the same or similar through AI-based learning of the shopping category. The video production device 130 extracts ratio information of the video production price for each video providing device 140 set in the existing same/similar goods/services determined to have high video effects, video distribution period information, and platform video targeting information.

영상 제작장치(130)는 동영상 제공장치(140)별 영상 제작 금액의 비율 정보, 영상 배포 기간 정보, 영상 타겟팅 정보의 산술 평균값, 중간값 또는 영상 효과 우선순위로 가중치를 부여한 값을 제작자 단말기(110)로 전송한다.The video production device 130 applies a weighted value to the ratio information of the video production price for each video providing device 140, the video distribution period information, the arithmetic mean value, the median value, or the video effect priority of the video targeting information to the producer terminal 110 ) is sent to

도 6은 본 실시예에 따른 제작자 정보와 영상 타겟팅 정보를 대응시키기 위해 클러스터링 방법을 나타낸 도면이다.6 is a diagram illustrating a clustering method in order to match producer information and image targeting information according to the present embodiment.

영상 제작장치(130)는 제작자 정보 중 타겟 연령층 정보에 대해 클러스터링을 수행한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 입력받은 타겟 연령층 정보와 복수의 영상 각각의 영상 화질 카테고리, 영상 타입 카테고리, 영상 톤 카테고리가 입력되어 클러스터링이 수행될 수 있다.The image production apparatus 130 performs clustering on target age group information among the producer information. The image production apparatus 130 may perform clustering by inputting target age group information received from the producer terminal 110 and an image quality category, an image type category, and an image tone category of each of the plurality of images.

영상 제작장치(130)는 영상 화질 카테고리 정보를 기반으로 한 제1 클러스터링을 수행할 수 있다. 영상 제작장치(130)는 영상 화질 카테고리 각각을 하나의 클러스터 중심으로 설정하고, 타겟 정보로서 입력될 수 있는 데이터들에 대한 클러스터링을 수행할 수 있다.The image production apparatus 130 may perform the first clustering based on image quality category information. The image production apparatus 130 may set each image quality category as one cluster center, and may perform clustering on data that may be input as target information.

영상 제작장치(130)는 4K 화질, UHD 화질, UWQHD 화질, WQHD 화질, QHD 화질, WFHD 화질, FHD 화질, HD 화질 등과 같은 해상도를 구분하는 단어를 타겟 정보로서 입력할 수 있다. 영상 제작장치(130)는 해상도 구분 단어와 클러스터 중심과의 거리는 언어 인접도를 기반으로 구분할 수 있다. The image production apparatus 130 may input a word for classifying resolutions such as 4K image quality, UHD image quality, UWQHD image quality, WQHD image quality, QHD image quality, WFHD image quality, FHD image quality, and HD image quality as target information. The image production apparatus 130 may classify the distance between the resolution-separated word and the cluster center based on the linguistic proximity.

영상 제작장치(130)는 화질 관련된 문서(또는 웹 페이지)를 추출하고, 각 단어 간의 인접도가 얼마나 가까운지를 판단하여 클러스터 중심과의 거리가 결정될 수 있다. The image production apparatus 130 extracts a document (or web page) related to image quality, and determines how close the adjacencies between words are, so that the distance from the cluster center may be determined.

영상 제작장치(130)는 4096×2160, 3840×2160, 3440×1440, 2560×1440, 2560×1080, 1920×1080, 1280×720 등과 같은 집합을 추출하고, 집합 추출 빈도 및 단어 간 밀접도를 고려하여 클러스터 중심과 해당 단어의 언어 인접도를 추출하여, 클러스터를 생성할 수 있다.The image production apparatus 130 extracts sets such as 4096×2160, 3840×2160, 3440×1440, 2560×1440, 2560×1080, 1920×1080, 1280×720, etc., and considers set extraction frequency and closeness between words Thus, a cluster can be created by extracting the cluster center and the linguistic proximity of the corresponding word.

영상 제작장치(130)는 'FHD'와 '1920×1080' 간의 단어 거리가 가까울수록 단어 간 밀집도가 상대적으로 높고, 단어 밀집도가 높은 문서가 많이 추출될수록 단어 집합 추출 빈도가 높게 결정할 수 있다.The image production apparatus 130 may determine that the closer the word distance between 'FHD' and '1920 × 1080' is, the higher the word density is, and the more documents with high word density are extracted, the higher the word set extraction frequency is.

영상 제작장치(130)는 클러스터링을 기반으로 분류가 어렵거나 분류는 되나 클러스터 중심과 멀어질 경우, 인공 지능 챗봇을 통해 제작자 단말기(110)로 추가적으로 질의하여 보다 정확한 답변을 들어 분류를 영상 화질 카테고리에 대한 분류를 수행할 수 있다.The image production device 130 makes an additional query to the producer terminal 110 through an artificial intelligence chatbot when it is difficult to classify based on clustering or the classification is far from the center of the cluster. classification can be performed.

도 7은 본 실시예에 따른 영상 제작장치의 영상 최적화 방법을 나타낸 도면이다.7 is a diagram illustrating an image optimization method of the image production apparatus according to the present embodiment.

영상 제작장치(130)는 피드백받은 영상 효과를 능동적으로 학습한다. 영상 제작장치(130)는 제1 영상 설정 정보, 제2 영상 설정 정보, 제3 영상 설정 정보에 따른 영상 클릭률에 대한 확률 분포(이하, 영상 클릭률 확률 분포)를 확인한다. The image production apparatus 130 actively learns the feedback image effect. The image production apparatus 130 checks a probability distribution (hereinafter, an image click rate probability distribution) for an image click rate according to the first image setting information, the second image setting information, and the third image setting information.

영상 제작장치(130)는 복수의 영상 각각에 설정된 영상 설정에 따라 영상 클릭률 확률 분포가 결정되어 영상 클릭률에 대한 예측이 가능하다. 영상 제작장치(130)는 복수의 영상 중 영상 타겟팅 정보의 설정에 따른 영상 클릭률 확률 분포의 예측을 수행한다.The image production apparatus 130 determines the image click-through rate probability distribution according to image settings set for each of the plurality of images, so that the image click-through rate can be predicted. The image production apparatus 130 predicts the image click-through rate probability distribution according to the setting of image targeting information among a plurality of images.

영상 제작장치(130)는 기존 영상에 따른 기존 영상 효과에 대한 머신 러닝을 수행하고, 머신 러닝 결과를 기반으로 새로운 영상이 입력되는 경우, 영상에 따른 예측 영상 효과(예를 들어, 영상 클릭률 확률 분포)를 결정한다.The image production apparatus 130 performs machine learning on an existing image effect according to an existing image, and when a new image is input based on the machine learning result, a predicted image effect (eg, image click-through rate probability distribution) according to the image ) to determine

영상 제작장치(130)는 다양한 제작자 단말기(110)로부터 상품K에 대하여 A라는 세팅의 영상을 입력받고, 영상 효과X를 획득할 수 있다. 영상 제작장치(130)는 머신 러닝 결과를 기반으로 새로운 제작자 단말기(110)로부터 상품K 또는 유사 상품K'에 대하여 A라는 세팅의 영상을 입력받는 경우, 유사한 영상 효과X를 가질 것이라고 예측할 수 있다. The image production apparatus 130 may receive an image of setting A for product K from various producer terminals 110 and obtain image effect X. The image production apparatus 130 may predict that a similar image effect X will be obtained when an image of the setting A for product K or similar product K' is received from the new producer terminal 110 based on the machine learning result.

영상 제작장치(130)는 다양한 제작자 단말기(110)로부터 특정 상품에 대하여 B라는 세팅의 영상을 입력받으면, 영상 효과X를 얻은 것으로 가정할 수 있다. 영상 제작장치(130)는 머신 러닝 결과를 기반으로 새로운 제작자 단말기(110)로부터 특정 상품에 대하여 B에서 약간 변화된 B'라는 세팅의 영상을 입력받을 경우, 영상 효과 X를 영상 효과 Y로 변화시킬 것이라고 예측할 수 있다. 영상 제작장치(130)는 지속적인 영상에 따른 영상 효과에 대한 학습으로 예측 정확도를 향상시킬 수 있다.The image production apparatus 130 may assume that the image effect X is obtained when receiving an image of the setting B for a specific product from the various producer terminals 110 . The image production apparatus 130 will change the image effect X to the image effect Y when receiving an image of the setting B' slightly changed from B for a specific product from the new producer terminal 110 based on the machine learning result. predictable. The image production apparatus 130 may improve prediction accuracy by continuously learning about image effects according to images.

영상 제작장치(130)는 제1 영상 설정 정보를 이용하여 영상 클릭률에 대한 상대적으로 낮은 예측 정확도를 산출한다. 영상 제작장치(130)는 제1 영상 설정 정보를 이용하는 경우, 특정 영상 클릭률에 대한 확률값에 대한 예측이 어렵다. 구체적으로 영상 제작장치(130)는 제1 영상 설정 정보를 이용하는 경우, 영상 클릭률 확률 분포에 있어서 특정 영상 클릭률에 대한 첨도(kurtosis)가 높지 않으므로 영상 클릭률에 대한 예측의 정확도가 상대적으로 높지 않다.The image production apparatus 130 calculates a relatively low prediction accuracy with respect to the image click-through rate by using the first image setting information. When the image production apparatus 130 uses the first image setting information, it is difficult to predict a probability value for a specific image click-through rate. Specifically, when the first image setting information is used, the image production apparatus 130 does not have high kurtosis with respect to a specific image click-through rate in the image click-through rate probability distribution, so that the prediction accuracy for the image click-through rate is not relatively high.

영상 제작장치(130)는 제2 영상 설정 정보를 이용하여 제1 영상 설정 정보보다 영상 클릭률에 대한 높은 예측 정확도를 산출하나, 제3 영상 설정 정보보다 낮은 영상 클릭률에 대한 예측 정확도를 산출한다. 영상 제작장치(130)는 제2 영상 설정 정보를 이용하는 경우, 영상 클릭률 확률 분포에 있어서 특정 영상 클릭률에 대한 첨도(kurtosis)가 상대적으로 높지만, 첨도가 높은 부분의 영상 클릭률이 상대적으로 높은값이 아닌 확률 분포를 예측한다. The image production apparatus 130 uses the second image setting information to calculate a higher prediction accuracy for an image click-through rate than the first image setting information, but calculates a prediction accuracy for an image click-through rate lower than the third image setting information. When the image production apparatus 130 uses the second image setting information, kurtosis for a specific image click rate in the image click rate probability distribution is relatively high, but the image click rate of the part with high kurtosis is not a relatively high value. Predict the probability distribution.

구체적으로 영상 제작장치(130)는 제2 영상 설정 정보를 이용하는 경우, 특정 영상 클릭률에 대한 확률값이 다른 영상 클릭률과 비교하여 상대적으로 높지만, 높은 확률값을 가지는 영상 클릭률이 제3 영상 설정 정보와 비교하여 상대적으로 작은 값을 갖는 확률 분포를 예측한다. 다시 말해, 영상 제작장치(130)는 중간 정도의 영상 클릭률이 높은 확률로 예측되는 경우로서 예측이 된 것이기는 하나, 영상 효과가 높지 않게 예측된 확률 분포를 예측한다.Specifically, when the image production apparatus 130 uses the second image setting information, the probability value for a specific image click rate is relatively high compared to other image click rates, but the image click rate having a high probability value is compared with the third image setting information. Predict a probability distribution with a relatively small value. In other words, the image production apparatus 130 predicts a probability distribution in which the image effect is not high, although it is predicted as a case in which the image click-through rate of a medium degree is predicted with a high probability.

영상 제작장치(130)는 제3 영상 설정 정보를 이용하여 제1 영상 설정 정보, 제2 영상 설정 정보보다 높은 영상 클릭률에 대한 예측 정확도를 산출한다. 영상 제작장치(130)는 제3 영상 설정 정보를 이용하는 경우, 특정 영상 클릭률에 대한 확률값이 다른 영상 클릭률과 비교하여 상대적으로 높고, 높은 확률값을 가지는 영상 클릭률이 제2 영상 설정 정보와 비교하여 상대적으로 큰 값으로 확률 분포를 예측한다. 다시 말해, 영상 제작장치(130)는 높은 영상 클릭률이 높은 확률로 예측되는 경우로서 제3 영상 설정 정보를 사용하는 홍보 전략을 제1 영상 설정 정보, 제2 영상 설정 정보와 비교하여 상대적으로 최적의 홍보 전략으로 선택한다.The image production apparatus 130 calculates a prediction accuracy with respect to an image click-through rate higher than the first image setting information and the second image setting information by using the third image setting information. When the image production apparatus 130 uses the third image setting information, the probability value for a specific image click rate is relatively high compared to other image click rates, and the image click rate having a high probability value is relatively high compared to the second image setting information. Predict the probability distribution with a large value. In other words, the image production apparatus 130 compares the promotion strategy using the third image setting information with the first image setting information and the second image setting information as a case in which a high image click-through rate is predicted with a high probability, and is relatively optimal. Select it as a promotional strategy.

따라서, 영상 제작장치(130)는 최적의 홍보 전략에 대한 학습으로 제작자 단말기(110)로 최적의 영상을 제안한다. 영상 제작장치(130)는 제작자 단말기(110)로부터 별도의 영상 타겟팅 정보에 대한 설정이 없이도 영상 제작장치(130)에 의해 결정된 최적의 영상 타겟팅 정보를 기반으로 한 영상을 제작할 수 있다.Accordingly, the image production apparatus 130 proposes an optimal image to the producer terminal 110 by learning about an optimal promotional strategy. The image production apparatus 130 may produce an image based on the optimal image targeting information determined by the image production apparatus 130 without additional setting of image targeting information from the producer terminal 110 .

영상 제작장치(130)는 지속적인 영상과 영상 효과에 대한 피드백이 진행될수록 영상 클릭률 확률 분포의 형태가 개선되어(예측력이 개선되어), 특정 영상 클릭률에 대한 첨도(Kurtosis)가 높은 형태로 변화될 수 있다.In the image production apparatus 130, the shape of the image click rate probability distribution is improved (prediction power is improved) as the feedback on the continuous image and image effect progresses, and the kurtosis for a specific image click rate can be changed to a high form. have.

확률 분포의 첨도(kurtosis)가 임계 첨도값 이상으로 충분히 높다고 판단되는 경우, 영상 제작장치(130)는 머신 러닝 결과를 기반으로 영상에 포함되는 하위 정보 중 특정 하위 정보를 변화시킬 경우(예컨대, 영상 타겟팅 정보 중 특정 하위 정보의 설정을 변화시킬 경우), 더욱 높은 성과의 영상 결과를 낼 것으로 예측되는 홍보 전략을 선택하여 영상을 제작할 수 있다.When it is determined that the kurtosis of the probability distribution is sufficiently high above the threshold kurtosis value, the image production apparatus 130 changes specific sub-information among sub-information included in the image based on the machine learning result (eg, image In the case of changing the setting of specific sub-information among targeting information), a video can be produced by selecting a promotion strategy that is predicted to produce a higher performance video result.

도 8은 본 실시예에 따른 영상 제작장치의 영상 클릭률 확률 분포의 예측 방법을 나타낸 도면이다.8 is a diagram illustrating a method of predicting an image click-through rate probability distribution of the image production apparatus according to the present embodiment.

영상 제작장치(130)는 영상 제작장치(130)는 제작한 영상에 대해 지속적으로 피드백받아 학습을 수행한다. 영상 제작장치(130)는 피드백된 정보를 머신 러닝하여 영상에 따른 영상 효과를 예측한다. 영상 제작장치(130)는 대상 객체 및 영상 타겟팅 정보를 포함한 영상을 제작한다.The image production apparatus 130 continuously receives feedback on the image produced by the image production apparatus 130 and performs learning. The image production apparatus 130 predicts an image effect according to an image by machine learning the fed back information. The image production apparatus 130 produces an image including a target object and image targeting information.

영상 제작장치(130)는 대상 객체 및 영상 타겟팅 정보를 기반으로 머신 러닝을 수행한다. 영상 제작장치(130)는 하위 영상 타겟팅 정보로서 제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보, 제3 하위 영상 타겟팅 정보를 포함하는 영상 타겟팅 정보를 머신 러닝한다. The image production apparatus 130 performs machine learning based on the target object and image targeting information. The image production apparatus 130 machine-learizes image targeting information including the first lower image targeting information, the second lower image targeting information, and the third lower image targeting information as lower image targeting information.

영상 제작장치(130)는 영상 타겟팅 정보에 포함되는 하위 영상 타겟팅 정보(제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보 및 제3 하위 영상 타겟팅 정보)를 하나의 데이터 세트로 규정한다. 영상 제작장치(130)는 데이터 세트를 기반으로 클러스터링이 수행한다(S810).The image production apparatus 130 defines the lower image targeting information (the first lower image targeting information, the second lower image targeting information, and the third lower image targeting information) included in the image targeting information as one data set. The image production apparatus 130 performs clustering based on the data set (S810).

영상 제작장치(130)는 정보 간의 유사도를 기반으로 데이터 간의 거리를 규정한다. 영상 제작장치(130)는 제1 하위 영상 타겟팅 정보에 포함된 상품에 대한 쇼핑 카테고리를 기반으로 상품 간의 유사 거리를 결정한다.The image production apparatus 130 defines a distance between data based on the similarity between information. The image production apparatus 130 determines a similar distance between products based on a shopping category for a product included in the first lower image targeting information.

영상 제작장치(130)는 제2 하위 영상 타겟팅 정보에 포함된 나이에 대한 카테고리를 기반으로 나이 간의 유사 거리를 결정한다. 영상 제작장치(130)는 제3 하위 영상 타겟팅 정보에 포함된 성별에 대한 카테고리, 직업 카테고리를 기반으로 성별, 직업 간의 유사 거리가 결정한다.The image production apparatus 130 determines the similarity distance between the ages based on the age category included in the second lower image targeting information. The image production apparatus 130 determines a similar distance between gender and occupation based on the gender category and occupation category included in the third lower image targeting information.

영상 제작장치(130)는 새로운 영상 타겟팅 정보에 대한 클러스터 결정 및 임계 거리 데이터 세트 추출한다(S820). 영상 제작장치(130)는 영상 효과(영상 클릭률 확률 분포)에 대한 예측을 수행한다(S830).The image production apparatus 130 determines a cluster for new image targeting information and extracts a threshold distance data set (S820). The image production apparatus 130 predicts the image effect (image click rate probability distribution) (S830).

영상 제작장치(130)는 데이터 세트를 기반으로 클러스터링이 수행되는 경우, 특정 영상 타겟팅 정보에 대한 예측을 수행한다. 영상 제작장치(130)는 새로운 영상 타겟팅 정보가 입력될 경우, 영상 타겟팅 정보를 포함하는 클러스터 및 임계 거리 이내의 인접한 데이터 세트를 추출하여 영상 효과에 대한 예측을 수행하고 영상 클릭률 확률 분포를 결정한다.When clustering is performed based on a data set, the image production apparatus 130 predicts specific image targeting information. When new image targeting information is input, the image production apparatus 130 extracts a cluster including the image targeting information and an adjacent data set within a threshold distance to predict an image effect and determine an image click-through rate probability distribution.

영상 제작장치(130)는 영상 클릭률 확률 분포를 기반으로 영상 타겟팅 정보 최적화 절차를 수행한다(S840).The image production apparatus 130 performs an image targeting information optimization procedure based on the image click-through rate probability distribution (S840).

영상 제작장치(130)는 클러스터 및 인접 데이터 세트를 기반으로 예측된 영상 효과(또는 영상 결과 정보)가 좋지 않은 경우, 제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보 및 제3 하위 영상 타겟팅 정보 중 적어도 하나를 변경할 수 있다.When the image effect (or image result information) predicted based on the cluster and the adjacent data set is not good, the image production apparatus 130 performs the first sub-image targeting information, the second sub-image targeting information, and the third sub-image targeting information. At least one of them can be changed.

영상 제작장치(130)는 제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보 및 제3 하위 영상 타겟팅 정보 각각 또는 제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보 및 제3 하위 영상 타겟팅 정보의 조합을 변경하여 새롭게 클러스터링을 수행한다. The image production apparatus 130 may include each of the first sub-image targeting information, the second sub-image targeting information, and the third sub-image targeting information or the first sub-image targeting information, the second sub-image targeting information, and the third sub-image targeting information. Change the combination to perform new clustering.

영상 제작장치(130)는 영상 효과가 최대인 클러스터에 대한 탐색을 수행하여 최대 영상 효과 클러스터인 하위 영상 타겟팅 정보(제1 하위 영상 타겟팅 정보, 제2 하위 영상 타겟팅 정보 및 제3 하위 영상 타겟팅 정보)를 홍보 전략으로 선택한다.The image production apparatus 130 performs a search for a cluster having a maximum image effect to obtain lower image targeting information (first lower image targeting information, second lower image targeting information, and third lower image targeting information) that is the maximum image effect cluster by performing a search for a cluster having a maximum image effect. as a promotional strategy.

영상 제작장치(130)는 1차적으로 영상 타겟팅 정보가 최적의 값으로 설정되는 경우에도 영상 효과가 높지 않은 경우, 2차적으로 대상 객체를 수정한다.The image production apparatus 130 primarily modifies the target object when the image effect is not high even when the image targeting information is set to an optimal value.

영상 제작장치(130)는 해당 클러스터의 영상의 특성을 분석한다(S850). 영상 제작장치(130)는 영상을 최적화한다(S860).The image production apparatus 130 analyzes the characteristics of the image of the corresponding cluster (S850). The image production apparatus 130 optimizes the image (S860).

영상 제작장치(130)는 영상 상에서 대상 객체(예컨대, 상품의 크기/위치, 상표의 크기/위치, 카피 문구의 크기/위치, 가격 정보의 크기/위치 등)을 분석하여 영상을 변경시킨다. 영상 제작장치(130)는 대상 객체의 우선순위를 설정하여 우선순위 별로 대상 객체를 변경하여 영상 효과에 대해 추가적인 피드백을 받는다.The image production apparatus 130 changes the image by analyzing the target object (eg, size/position of a product, size/position of a brand, size/position of copy text, size/position of price information, etc.) on the image. The image production apparatus 130 sets the priority of the target object, changes the target object for each priority, and receives additional feedback on the image effect.

영상 제작장치(130)는 대상 객체의 변경 우선순위를 결정하기 위해 동일 및/또는 유사 범위(영상 타겟팅 정보의 설정 값의 범위를 기준으로 정의)의 영상 타겟팅 정보를 설정하였으나, 복수의 동영상 제공장치(140) 상에서 영상 효과의 차이가 존재하는 대상 객체 간의 차이(예를 들어, 객체 위치 크기 등)를 분석한다. The image production apparatus 130 sets the image targeting information in the same and/or similar range (defined based on the range of the set value of the image targeting information) to determine the change priority of the target object, but a plurality of video providing apparatuses In step 140, a difference (eg, object position size, etc.) between target objects in which a difference in image effect exists is analyzed.

영상 제작장치(130)는 대상 객체 간의 차이를 분석하여 어떠한 대상 객체 이미지 상에서 차이가 영상 효과의 차이를 불러왔는지를 결정하여 이미지 요소의 변경 우선순위를 결정한다.The image production apparatus 130 analyzes the difference between the target objects to determine on which target object image the difference causes a difference in the video effect, and determines the change priority of the image element.

도 8에서는 S810 내지 S860을 순차적으로 실행하는 것으로 기재하고 있으나, 반드시 이에 한정되는 것은 아니다. 다시 말해, 도 8에 기재된 단계를 변경하여 실행하거나 하나 이상의 단계를 병렬적으로 실행하는 것으로 적용 가능할 것이므로, 도 8은 시계열적인 순서로 한정되는 것은 아니다.Although it is described that S810 to S860 are sequentially executed in FIG. 8 , it is not necessarily limited thereto. In other words, since it may be applicable to changing and executing the steps described in FIG. 8 or executing one or more steps in parallel, FIG. 8 is not limited to a chronological order.

전술한 바와 같이 도 8에 기재된 본 실시예에 따른 영상 클릭률 확률 분포의 예측 방법은 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 본 실시예에 따른 영상 클릭률 확률 분포의 예측 방법을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. As described above, the method for predicting the image click-through rate probability distribution according to the present embodiment described in FIG. 8 may be implemented as a program and recorded in a computer-readable recording medium. The computer-readable recording medium in which the program for implementing the method of predicting the image click-through rate probability distribution according to the present embodiment is recorded and includes all kinds of recording devices in which data readable by the computer system is stored.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of this embodiment, and a person skilled in the art to which this embodiment belongs may make various modifications and variations without departing from the essential characteristics of the present embodiment. Accordingly, the present embodiments are intended to explain rather than limit the technical spirit of the present embodiment, and the scope of the technical spirit of the present embodiment is not limited by these embodiments. The protection scope of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be interpreted as being included in the scope of the present embodiment.

110: 제작자 단말기
120: 네트워크
130: 영상 제작장치
140: 동영상 제공장치
110: maker terminal
120: network
130: video production device
140: video providing device

Claims (5)

제작자 단말기로부터 키워드를 입력받는 키워드 입력부;
복수의 동영상 제공장치로부터 상기 키워드에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 레퍼런스 영상을 생성하는 레퍼런스 영상 생성부;
상기 제작자 단말기로부터 영상 정보를 입력받는 영상 정보 입력부;
상기 영상 정보를 분석한 분석 결과를 생성하고, 상기 복수의 동영상 제공장치로부터 상기 분석 결과에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 맞춤 영상을 생성하는 맞춤 영상 생성부; 및
상기 레퍼런스 영상과 상기 맞춤 영상을 조합하여 영상을 제작하는 영상 제작부를 포함하되,
상기 레퍼런스 영상 생성부는 상기 키워드에 대응하는 영상 중 조회수, 좋아요 횟수, 댓글수, 공유 횟수 중 하나 이상의 정보를 기반으로 1차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상으로 추출하고, 상기 키워드에 대응하는 영상 중 CF(Commercial Film) 수상실적을 갖는 영상을 객관적인 지표로서 데이터를 2차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상으로 추출하고, 상기 1차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상과 상기 2차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상을 조합한 후 기 설정된 개수 단위로 리스트로 생성하여 상기 제작자 단말기로 전송하며, 상기 리스트에 포함된 영상 중 상기 제작자 단말기가 선택한 영상을 재생시키고, 재생된 영상의 재생시간, 재생완성률, 재생 구간을 기반으로 제작자 선호도를 산출하고, 상기 리스트에 포함된 영상 중 상기 제작자 선호도에 해당하는 영상을 선별하여 상기 레퍼런스 영상을 생성하며, 상기 제작자 선호도를 기반으로 유사한 영상을 추가로 검색하여 상기 리스트에 추가하며, 상기 리스트에 포함된 영상 각각의 총 재생시간을 기반으로 재생 구간을 분할하고, 상기 총 재생시간 대비 상기 재생시간을 기반으로 재생 완성률을 확인하며, 상기 리스트에 포함된 영상 각각의 전체 재생구간을 임의의 재생구간으로 분할하고, 상기 임의의 재생구간이 길수록 해당 영상의 카테고리, 속성, 제목이 상기 제작자 선호도에 부합하는 것으로 인지하며, 상기 제작자 단말기에 대응하는 제작자 계정에서 기 설정한 카테고리 정보를 영상 화질 카테고리, 영상 타입 카테고리, 영상 톤 카테고리 중 어느 하나인 것을 확인하고, 상기 기 설정한 카테고리에 대응하는 배경화면, 음악, 텍스트에 가중치를 반영하여 상기 레퍼런스 영상을 생성하며,
상기 맞춤 영상 생성부는 상기 영상 정보에 해당하는 제품군을 분석하고, 상기 제품군을 포함하고 있는 영상을 기반으로 상기 맞춤 영상을 생성하며, 상기 영상 정보로부터 영상 분량, 영상 타입, 영상 톤, 영상 소스, BGM, 문구를 추출하고, 상기 영상 소스에 상기 영상 톤, 상기 영상 타입을 적용한 상태에서 상기 BGM, 상기 문구를 삽입하여 상기 영상 분량만큼 재생되도록 하는 상기 맞춤 영상을 생성하며, 상기 맞춤 영상에 대한 상기 제작자 단말기로부터 수신한 피드백 정보를 수신하여 학습한 학습 결과를 생성한 후 상기 학습 결과를 상기 맞춤 영상을 생성할 때 반영하며, 웹소설, 시로부터 상기 문구에 대응하는 긴 문장, 철학적인 문장을 추출하여 상기 맞춤 영상에 삽입하는 것을 특징으로 하는 영상 제작장치.
a keyword input unit for receiving keywords from the manufacturer's terminal;
a reference image generator for generating a reference image by selecting only free data from among a background screen, music, and text corresponding to the keyword from a plurality of video providing devices;
an image information input unit for receiving image information from the producer terminal;
a customized image generator for generating an analysis result by analyzing the image information, and generating a customized image by selecting only free data among background screens, music, and text corresponding to the analysis results from the plurality of video providing devices; and
Comprising an image production unit to produce an image by combining the reference image and the custom image,
The reference image generator primarily extracts an image having a higher correlation than a preset threshold based on one or more of the number of views, the number of likes, the number of comments, and the number of shares among the images corresponding to the keyword, and extracts the image corresponding to the keyword. Among the images, the image having the CF (Commercial Film) award record is extracted as an image having a higher correlation than the preset threshold as an objective indicator, and the image having a correlation higher than the first preset threshold and the 2 After combining images having a higher correlation than a preset threshold, a list is created in units of a preset number and transmitted to the producer terminal, and an image selected by the producer terminal among the images included in the list is played back, Producer preference is calculated based on the reproduction time, reproduction completion rate, and reproduction section of the image, and the reference image is generated by selecting an image corresponding to the producer preference among the images included in the list, and based on the producer preference Similar videos are additionally searched for and added to the list, the playback section is divided based on the total playback time of each video included in the list, and the playback completion rate is checked based on the playback time compared to the total playback time, , divides the entire playback section of each video included in the list into arbitrary playback sections, and recognizes that the longer the optional playback section, the longer the category, attribute, and title of the video match the producer preference, the producer terminal Check that the category information set in the creator account corresponding to the video quality category is any one of the video quality category, the video type category, and the video tone category, and by reflecting the weight on the background screen, music, and text corresponding to the preset category, generating the reference image,
The customized image generating unit analyzes a product group corresponding to the image information, generates the customized image based on an image including the product family, and from the image information an image quantity, an image type, an image tone, an image source, and a BGM , extracting a phrase, and inserting the BGM and the phrase in a state where the video tone and the video type are applied to the video source to generate the customized video to be played back by the amount of the video, and the creator for the customized video After generating the learned learning result by receiving the feedback information received from the terminal, the learning result is reflected when generating the customized image, and long sentences and philosophical sentences corresponding to the above phrases are extracted from web novels and poems. Image production apparatus, characterized in that inserted into the customized image.
제1항에 있어서,
상기 레퍼런스 영상과 상기 맞춤 영상으로부터 배경 영상과 대상 객체를 구분하는 객체 분리부를 추가로 포함하며,
상기 영상 제작부는 상기 배경영상 내에 상기 대상 객체를 삽입하는 형태로 상기 영상을 제작하는 것을 특징으로 하는 영상 제작장치.
According to claim 1,
Further comprising an object separator for separating a background image and a target object from the reference image and the custom image,
The image production unit is an image production apparatus, characterized in that for producing the image in the form of inserting the target object in the background image.
제2항에 있어서,
상기 레퍼런스 영상과 상기 맞춤 영상으로부터 배경 음악만을 추출하는 배경음악 분리부를 추가로 포함하며,
상기 영상 제작부는 상기 배경 음악을 상기 배경영상에 따라 삽입하는 형태로 상기 영상을 제작하는 것을 특징으로 하는 영상 제작장치.
3. The method of claim 2,
Further comprising a background music separation unit for extracting only the background music from the reference image and the customized image,
The image production unit is an image production apparatus, characterized in that for producing the image in the form of inserting the background music according to the background image.
제2항에 있어서,
상기 레퍼런스 영상과 상기 맞춤 영상에 포함된 텍스트를 인지하고, 상기 텍스트 중 상기 키워드와 상기 문구와 연관성을 갖는 단어 또는 문장을 추출하여 문구로 재조합하는 문구 생성부;를 추가로 포함하며,
상기 영상 제작부는 상기 문구를 상기 배경영상에 따라 삽입하는 형태로 상기 영상을 제작하는 것을 특징으로 하는 영상 제작장치.
3. The method of claim 2,
It further comprises; a phrase generator for recognizing the text included in the reference image and the customized image, extracting a word or sentence having a relationship with the keyword and the phrase from among the text and recombining it into a phrase,
The image production unit is an image production apparatus, characterized in that for producing the image in the form of inserting the phrase according to the background image.
영상 제작장치에서 제작자 단말기로부터 키워드를 입력받는 과정;
상기 영상 제작장치에서 복수의 동영상 제공장치로부터 상기 키워드에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 레퍼런스 영상을 생성하는 과정;
상기 영상 제작장치에서 상기 제작자 단말기로부터 영상 정보를 입력받는 과정;
상기 영상 제작장치에서 상기 영상 정보를 분석한 분석 결과를 생성하고, 상기 복수의 동영상 제공장치로부터 상기 분석 결과에 대응하는 배경화면, 음악, 텍스트 중 무료 데이터만을 선별하여 맞춤 영상을 생성하는 과정; 및
상기 영상 제작장치에서 상기 레퍼런스 영상과 상기 맞춤 영상을 조합하여 영상을 제작하는 과정을 포함하되,
상기 영상 제작장치에서 상기 레퍼런스 영상을 생성할 때, 상기 키워드에 대응하는 영상 중 조회수, 좋아요 횟수, 댓글수, 공유 횟수 중 하나 이상의 정보를 기반으로 1차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상으로 추출하고, 상기 키워드에 대응하는 영상 중 CF(Commercial Film) 수상실적을 갖는 영상을 객관적인 지표로서 데이터를 2차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상으로 추출하고, 상기 1차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상과 상기 2차적으로 기 설정된 임계치 보다 높은 연관성을 갖는 영상을 조합한 후 기 설정된 개수 단위로 리스트로 생성하여 상기 제작자 단말기로 전송하며, 상기 리스트에 포함된 영상 중 상기 제작자 단말기가 선택한 영상을 재생시키고, 재생된 영상의 재생시간, 재생완성률, 재생 구간을 기반으로 제작자 선호도를 산출하고, 상기 리스트에 포함된 영상 중 상기 제작자 선호도에 해당하는 영상을 선별하여 상기 레퍼런스 영상을 생성하며, 상기 제작자 선호도를 기반으로 유사한 영상을 추가로 검색하여 상기 리스트에 추가하며, 상기 리스트에 포함된 영상 각각의 총 재생시간을 기반으로 재생 구간을 분할하고, 상기 총 재생시간 대비 상기 재생시간을 기반으로 재생 완성률을 확인하며, 상기 리스트에 포함된 영상 각각의 전체 재생구간을 임의의 재생구간으로 분할하고, 상기 임의의 재생구간이 길수록 해당 영상의 카테고리, 속성, 제목이 상기 제작자 선호도에 부합하는 것으로 인지하며, 상기 제작자 단말기에 대응하는 제작자 계정에서 기 설정한 카테고리 정보를 영상 화질 카테고리, 영상 타입 카테고리, 영상 톤 카테고리 중 어느 하나인 것을 확인하고, 상기 기 설정한 카테고리에 대응하는 배경화면, 음악, 텍스트에 가중치를 반영하여 상기 레퍼런스 영상을 생성하며,
상기 영상 제작장치에서 상기 맞춤 영상을 생성할 때, 상기 영상 정보에 해당하는 제품군을 분석하고, 상기 제품군을 포함하고 있는 영상을 기반으로 상기 맞춤 영상을 생성하며, 상기 영상 정보로부터 영상 분량, 영상 타입, 영상 톤, 영상 소스, BGM, 문구를 추출하고, 상기 영상 소스에 상기 영상 톤, 상기 영상 타입을 적용한 상태에서 상기 BGM, 상기 문구를 삽입하여 상기 영상 분량만큼 재생되도록 하는 상기 맞춤 영상을 생성하며, 상기 맞춤 영상에 대한 상기 제작자 단말기로부터 수신한 피드백 정보를 수신하여 학습한 학습 결과를 생성한 후 상기 학습 결과를 상기 맞춤 영상을 생성할 때 반영하며, 웹소설, 시로부터 상기 문구에 대응하는 긴 문장, 철학적인 문장을 추출하여 상기 맞춤 영상에 삽입하는 것을 특징으로 하는 영상 제작 방법.
A process of receiving a keyword from a producer terminal in the video production apparatus;
generating a reference image by selecting only free data among background screens, music, and text corresponding to the keywords from a plurality of video providing devices in the image production device;
receiving image information from the producer terminal in the image production apparatus;
generating an analysis result of analyzing the image information in the image production device, and generating a customized image by selecting only free data among background screens, music, and text corresponding to the analysis results from the plurality of video providing devices; and
Comprising the process of producing an image by combining the reference image and the custom image in the image production apparatus,
When the image production device generates the reference image, based on one or more of the number of views, the number of likes, the number of comments, and the number of shares among the images corresponding to the keyword, the image having a correlation higher than a preset threshold is used primarily as an image Extracting, and extracting the image having a CF (Commercial Film) award performance among the images corresponding to the keyword as an objective index, extracting the data as an image having a correlation higher than a preset threshold, and firstly higher than the preset threshold After combining an image having a high correlation with an image having a secondary correlation higher than the preset threshold, a list is created in units of a preset number and transmitted to the producer terminal, and among the images included in the list, the producer terminal Plays the selected video, calculates producer preference based on the playback time, reproduction completion rate, and reproduction section of the reproduced video, and selects the video corresponding to the producer preference among the videos included in the list to generate the reference video and additionally search for similar videos based on the producer preference and add them to the list, divide the playback section based on the total playback time of each video included in the list, and calculate the playback time compared to the total playback time. Based on the playback completion rate, the entire playback section of each video included in the list is divided into arbitrary playback sections, and the longer the random playback section, the longer the category, attribute, and title of the video match the producer’s preference Recognizing that, the category information preset in the producer account corresponding to the producer terminal is any one of an image quality category, an image type category, and an image tone category, and a background screen corresponding to the preset category; The reference image is generated by reflecting the weights on the music and text,
When the image production apparatus generates the customized image, the product group corresponding to the image information is analyzed, the customized image is generated based on the image including the product family, and the image quantity and image type from the image information , extracting the image tone, image source, BGM, and phrase, and inserting the BGM and the phrase in a state where the image tone and the image type are applied to the image source to generate the customized image to be reproduced by the amount of the image, , After generating a learned learning result by receiving feedback information from the producer terminal for the customized image, the learning result is reflected when generating the customized image, An image production method, characterized in that extracting a sentence or a philosophical sentence and inserting it into the customized image.
KR1020210038492A 2021-02-05 2021-03-25 Method and Apparatus for Producing Video Based on Artificial Intelligence KR102340963B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20210016440 2021-02-05
KR1020210016440 2021-02-05

Publications (1)

Publication Number Publication Date
KR102340963B1 true KR102340963B1 (en) 2021-12-20

Family

ID=79034043

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210038492A KR102340963B1 (en) 2021-02-05 2021-03-25 Method and Apparatus for Producing Video Based on Artificial Intelligence

Country Status (1)

Country Link
KR (1) KR102340963B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102523438B1 (en) 2022-11-29 2023-04-19 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements
KR102531572B1 (en) * 2023-02-10 2023-05-15 김재훈 Method of creating video making platform for users
KR102578169B1 (en) * 2023-03-14 2023-09-14 주식회사 웨이크유어마인드 System for Providing Auto Complete Service YouTube Thumbnail

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040036159A (en) * 2002-10-23 2004-04-30 엘지전자 주식회사 Audio And Video Edition Using Television Receiver Set
KR20150031918A (en) * 2013-09-17 2015-03-25 이성용 Method of preparing an advertisement images on image materials, preparation system using the same, and playing method on prepared image data
KR101577012B1 (en) * 2014-06-24 2015-12-11 (주)에듀필미디어 Method of composing multimedia data and video player for playing moving pictures in an android operating system
KR102093577B1 (en) * 2018-12-03 2020-05-15 이화여자대학교 산학협력단 Future video generating method based on neural network and future video producing appratus
KR20200141387A (en) * 2020-05-29 2020-12-18 (주)사맛디 System, method and program for searching image data by using deep-learning algorithm

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040036159A (en) * 2002-10-23 2004-04-30 엘지전자 주식회사 Audio And Video Edition Using Television Receiver Set
KR20150031918A (en) * 2013-09-17 2015-03-25 이성용 Method of preparing an advertisement images on image materials, preparation system using the same, and playing method on prepared image data
KR101577012B1 (en) * 2014-06-24 2015-12-11 (주)에듀필미디어 Method of composing multimedia data and video player for playing moving pictures in an android operating system
KR102093577B1 (en) * 2018-12-03 2020-05-15 이화여자대학교 산학협력단 Future video generating method based on neural network and future video producing appratus
KR20200141387A (en) * 2020-05-29 2020-12-18 (주)사맛디 System, method and program for searching image data by using deep-learning algorithm

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102523438B1 (en) 2022-11-29 2023-04-19 (주)비디오몬스터 System and method for automatic video editing using utilization of auto labeling and insertion of design elements
KR102531572B1 (en) * 2023-02-10 2023-05-15 김재훈 Method of creating video making platform for users
KR102578169B1 (en) * 2023-03-14 2023-09-14 주식회사 웨이크유어마인드 System for Providing Auto Complete Service YouTube Thumbnail

Similar Documents

Publication Publication Date Title
Moscato et al. An emotional recommender system for music
KR102340963B1 (en) Method and Apparatus for Producing Video Based on Artificial Intelligence
Bogdanov et al. Semantic audio content-based music recommendation and visualization based on user preference examples
Shah et al. Advisor: Personalized video soundtrack recommendation by late fusion with heuristic rankings
Braunhofer et al. Location-aware music recommendation
US20140164507A1 (en) Media content portions recommended
US20140163980A1 (en) Multimedia message having portions of media content with audio overlay
CN106062730A (en) Systems and methods for actively composing content for use in continuous social communication
CN109165302A (en) Multimedia file recommendation method and device
KR20120132465A (en) Method and system for assembling animated media based on keyword and string input
KR20120088650A (en) Estimating and displaying social interest in time-based media
CN113569088A (en) Music recommendation method and device and readable storage medium
US20220157300A1 (en) Generation of interactive audio tracks from visual content
US20130318021A1 (en) Information processing apparatus, information processing method, and program
Bhattacharjee et al. Identifying the causal relationship between social media content of a Bollywood movie and its box-office success-a text mining approach
CN113469152B (en) Similar video detection method and device
Hyung et al. Utilizing context-relevant keywords extracted from a large collection of user-generated documents for music discovery
Kalender et al. Videolization: knowledge graph based automated video generation from web content
Fields et al. Using song social tags and topic models to describe and compare playlists
JP2008204355A (en) Dictionary creation method
Matsumoto et al. Music video recommendation based on link prediction considering local and global structures of a network
KR20220113221A (en) Method And System for Trading Video Source Data
CN116980665A (en) Video processing method, device, computer equipment, medium and product
Ibrahim et al. Large-scale text-based video classification using contextual features
Tsukuda et al. SmartVideoRanking: video search by mining emotions from time-synchronized comments

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant