KR20210136609A - Apparatus and method for generating image news contents - Google Patents
Apparatus and method for generating image news contents Download PDFInfo
- Publication number
- KR20210136609A KR20210136609A KR1020200055086A KR20200055086A KR20210136609A KR 20210136609 A KR20210136609 A KR 20210136609A KR 1020200055086 A KR1020200055086 A KR 1020200055086A KR 20200055086 A KR20200055086 A KR 20200055086A KR 20210136609 A KR20210136609 A KR 20210136609A
- Authority
- KR
- South Korea
- Prior art keywords
- news
- text
- video
- content
- image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000000284 extract Substances 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000001360 synchronised effect Effects 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 2
- 230000009193 crawling Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 3
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
본 발명은 뉴스 콘텐츠 생성 장치 및 방법에 관한 것으로서, 보다 구체적으로는 영상 뉴스 콘텐츠 생성 및 방법에 관한 것이다.The present invention relates to an apparatus and method for generating news content, and more particularly, to a method and method for generating video news content.
최근 언론사에서 제공하는 뉴스 서비스는 텍스트와 사진이 포함된 뉴스를 언론사 홈페이지 또는 인터넷 포털에 게재하고, 소비자들이 자신의 통신 단말을 통해서 언론사 서버 또는 인터넷 포털에 접속하여 뉴스를 확인하는 방식으로 제공된다.Recently, news services provided by media companies are provided in such a way that news including text and photos is posted on the website of the media company or internet portal, and consumers access the media server or internet portal through their communication terminals to check the news.
이러한 종래의 뉴스 서비스는 작은 텍스트를 일일이 뉴스 소비자들이 읽어야 하는 불편함이 있고, 뉴스에 포함된 사진 역시 단 하나의 사진으로 한정되므로 소비자들의 주목을 끌지 못하는 단점이 있다.Such a conventional news service is inconvenient for news consumers to read small texts one by one, and a photo included in the news is also limited to only one photo, so it has a disadvantage in not attracting the attention of consumers.
이러한 단점을 해소하기 위해서, 최근 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 뉴스 동영상을 제공하는 서비스가 제공되고 있으나, 이러한 뉴스 동영상은 해당 뉴스를 전달하기 위해서 오프라인상에서 언론사가 실제 제작하여 제공하는 것으로서, 실제 동영상 뉴스를 제작하는 방송사 등은 이러한 뉴스 서비스가 가능하지만, 텍스트 중심의 뉴스를 생산하는 신문사와 같은 언론사들은 이러한 서비스를 제공할 수 없는 문제점이 존재한다.In order to solve this disadvantage, a service that provides a news video by inserting a video player between news texts is recently provided. Broadcasting companies that produce video news can provide such a news service, but there is a problem that media companies such as newspaper companies that produce text-oriented news cannot provide such a service.
본 발명이 해결하고자 하는 과제는 단순한 텍스트 중심의 뉴스 콘텐츠에, 뉴스 소비자들이 집중하면서도 추가적인 정보를 제공할 수 있도록 영상을 삽입하고, 사용자들이 뉴스 텍스트를 직접 읽지 않아도 뉴스를 파악할 수 있도록 음성을 합성한 뉴스 콘텐츠를 생성하고 제공하는 것이다.The problem to be solved by the present invention is to insert an image in simple text-oriented news content so that news consumers can provide additional information while focusing, and synthesize voice so that users can understand the news without directly reading the news text. To create and provide news content.
상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 장치는, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스 콘텐츠를 수신하여 출력하는 뉴스 수집부; 상기 뉴스 수집부로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부, 이미지 선정부, 및 콘텐츠 생성부로 출력하는 텍스트 가공부; 상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부로 출력하는 음성 변환부; 상기 텍스트 가공부로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 이미지 선정부; 및 상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 상기 음성 변환부로부터 입력된 음성 데이터와 동기화시키고, 상기 이미지 선정부로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 콘텐츠 생성부를 포함한다.According to a preferred embodiment of the present invention for solving the above problems, there is provided an apparatus for generating video news content, comprising: a news collecting unit for receiving and outputting text-oriented news content from a plurality of media server servers or Internet portals; a text processing unit for processing text included in the news article input from the news collecting unit and outputting it to a voice converting unit, an image selecting unit, and a content generating unit; a voice conversion unit for converting the news text input from the text processing unit into voice and outputting the news text to the content generating unit; an image selecting unit for selecting images to be used in generating an image to be included in video news content from among images stored in an image DB using keywords of the article text input from the text processing unit; and converting the news text input from the text processing unit into subtitles, synchronizing the subtitles with the audio data input from the audio conversion unit, and editing the images inputted from the image selection unit to be synchronized with the audio data and subtitles. and a content generator for generating video news content by generating the video and combining the generated video with subtitles and audio data.
한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 방법은, 영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장하는 단계; 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집하는 단계; 상기 수집된 뉴스 콘텐츠의 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출하는 단계; 상기 수집된 뉴스 콘텐츠의 텍스트를 음성으로 변환하는 단계; 뉴스 콘텐츠의 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 단계; 뉴스 콘텐츠의 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키며, 상기 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 단계; 및 상기 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공하는 단계를 포함한다.On the other hand, in accordance with a preferred embodiment of the present invention for solving the above problems, there is provided a method for generating video news content, the method comprising: collecting and storing various images that can be used for video news content production; Collecting news content by receiving text-oriented news from a plurality of media server servers or Internet portals at regular time intervals or in real time; After refining and normalizing the text of the collected news content, performing context analysis and morphological analysis to process the text and extract keywords; converting the text of the collected news content into voice; selecting images to be used in generating an image to be included in the image news content from among images stored in an image DB by using keywords extracted from the text of the news content; Video news by converting text of news content into captions, synchronizing captions with audio data, editing the selected images to be synchronized with audio data and captions to create video, and combining the generated video with captions and audio data creating content; and providing the video news content to media company servers or Internet portals.
한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 장치는, 적어도 하나의 프로세서; 및 컴퓨터로 실행 가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되, 상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행 가능한 명령은, 상기 적어도 하나의 프로세서에 의해서, 상기 영상 뉴스 콘텐츠 생성 방법의 각 단계가 실행되도록 하는 것을 특징으로 한다.Meanwhile, an apparatus for generating video news content according to a preferred embodiment of the present invention for solving the above problems includes: at least one processor; and at least one memory for storing computer-executable instructions, wherein the computer-executable instructions stored in the at least one memory are executed by the at least one processor, each step of the method for generating video news content characterized in that it is executed.
본 발명은 단순한 텍스트 중심의 뉴스 콘텐츠를 API 또는 웹 크롤링 방식으로 언론사 서버 또는 인터넷 포털들로부터 수신하고, 해당 뉴스의 텍스트로부터 키워드를 추출하여 이에 대응되는 영상을 생성하여 뉴스 콘텐츠에 삽입하고, 해당 뉴스 텍스트를 음성으로 변환하여 뉴스 콘텐츠에 결합함으로써, 뉴스 소비자들의 집중도를 향상시키는 동시에, 뉴스 소비자들이 뉴스를 파악하는 수고를 감소시킴으로써, 뉴스 소비의 편의성과 효과를 증진시킬 수 있다.The present invention receives simple text-oriented news content from a media server or Internet portals through an API or web crawling method, extracts keywords from the text of the news, generates a corresponding image, and inserts it into the news content. By converting text into speech and combining it with news content, it is possible to improve the concentration of news consumers and at the same time reduce the effort of news consumers to understand the news, thereby enhancing the convenience and effectiveness of news consumption.
이 때, 본 발명은 뉴스 텍스트를 음성으로 변환하는 과정에서, 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리를 이용함으로써, 뉴스 소비자들의 주목도, 친근감, 및 뉴스 전달력을 향상시킬 수 있다.At this time, according to the present invention, by using the voices of famous entertainers, famous voice actors, and famous show hosts in the process of converting news text into voice, it is possible to improve the attention, friendliness, and news delivery power of news consumers.
도 1은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치가 본 발명의 서비스를 제공하기 위한 전체 구성들 간의 관계를 도시하는 도면이다.
도 2는 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치의 세부 구성을 도시하는 도면이다.
도 3은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법을 설명하는 흐름도이다.1 is a diagram illustrating a relationship between all components for providing a service of the present invention in an apparatus for generating video news according to a preferred embodiment of the present invention.
2 is a diagram illustrating a detailed configuration of an apparatus for generating video news according to a preferred embodiment of the present invention.
3 is a flowchart illustrating a video news generation method according to a preferred embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 설명한다.Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.
도 1은 본 발명의 바람직한 실시예에 따른 영상 영상 뉴스 생성 장치가 본 발명의 서비스를 제공하기 위한 전체 구성들 간의 관계를 도시하는 도면이다.1 is a diagram illustrating a relationship among all components for providing a service of the present invention in an apparatus for generating video image news according to a preferred embodiment of the present invention.
도 1을 참조하면, 본 발명의 영상 뉴스 콘텐츠 생성 장치(200)(이하, "영상 뉴스 생성 장치"로 약칭함)는 유무선 통신망을 통해서 복수의 언론서 서버들과 연결되어 언론사 서버들(110-1~110-N)로부터 텍스트 중심의 뉴스 콘텐츠를 일정한 시간 주기 또는 실시간으로 수집한다. 또한, 본 발명의 영상 뉴스 생성 장치(200)는 복수의 언론사 서버(110-1~110-N)가 인터넷 포털(120-1~120-N) 등에 게시한 뉴스 콘텐츠를 수집할 수도 있다. Referring to FIG. 1 , an
또한, 본 발명의 영상 뉴스 생성 장치(200)는 생성된 영상 뉴스 콘텐츠를 유무선 통신망을 통해서 언론사 서버들 또는 인터넷 포털 등으로 제공할 수 있다.Also, the video
한편, 본 발명의 영상 뉴스 생성 장치(200)는 유무선 통신망을 통해서 뉴스 소비자인 사용자 단말들과 연결되어, 영상 뉴스 생성 장치(200)에서 생성된 영상 뉴스 콘텐츠를 사용자 단말들로 직접 제공할 수도 있다.Meanwhile, the video
도 2는 본 발명의 바람직한 실시예에 따른 영상 영상 뉴스 생성 장치(200)의 세부 구성을 도시하는 도면이다.2 is a diagram illustrating a detailed configuration of a video video
도 2를 참조하여, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)의 세부 구성에 대해서 설명하면, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)는 뉴스 수집부(210), 텍스트 DB(220), 이미지 DB(230), 텍스트 가공부(240), 이미지 선정부(250), 음성 변환부(260), 콘텐츠 생성부(270), 및 뉴스 콘텐츠 제공부(280)를 포함하여 구성된다.Referring to FIG. 2 , the detailed configuration of the video
먼저, 뉴스 수집부(210)는 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털 등과 유무선 통신망을 통해서 상호 통신을 수행하여, API 방식으로 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스 콘텐츠를 수신하여 텍스트 가공부(240)로 출력한다.First, the
또한, 뉴스 수집부(210)는 일정한 시간 주기로 또는 실시간으로 웹 크롤링을 수행하여 텍스트 중심의 뉴스 콘텐츠를 수집하고, 수집된 뉴스 콘텐츠를 텍스트 가공부(240)로 출력한다.In addition, the
텍스트 가공부(240)는 뉴스 수집부(210)로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부(260), 이미지 선정부(250), 및 콘텐츠 생성부(270)로 출력한다. 또한, 텍스트 가공부(240)는 뉴스 수집부(210)로부터 입력된 뉴스 텍스트 및 가공된 뉴스 텍스트를 텍스트 DB(220)로 출력하여 저장할 수 있다.The
먼저, 텍스트 가공부(240)는 입력된 뉴스 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 키워드를 추출한다.First, the
이를 위해서, 텍스트 가공부(240)는 먼저 뉴스 텍스트에서 규칙에 기반한 표기가 다른 단어들을 통합하고, 대문자 및 소문자를 통합하며, 불필요한 단어(예컨대, 불용어, 길이가 임계치를 초과하는 긴 단어 또는 임계치에 못 미치는 짧은 단어, 특수 문자 등)를 제거한다. To this end, the
그리고, 텍스트 가공부(240)는 명사에 붙는 조사들을 분리하여 명사 중심으로 키워드를 추출한다. 이 때, 성폭행, 범죄, 마약 등을 나타내는 단어들은 배제하도록 처리될 수 있다. 또한, 텍스트 가공부(240)는 추출된 명사들의 반복 횟수 등을 카운트하여 키워드의 순위를 설정하여 출력할 수 있다. 이 때, 키워드가 주어로 이용된 경우에는 가중치를 부여하여 동일한 횟수의 키워드라도 주어로 이용된 명사에 대해서 더 높은 키워드 순위가 부여되도록 할 수 있다. 또한, 텍스트 가공부(240)는 각 문단별로 키워드를 추출하여 이미지 선정부(250)로 출력할 수도 있다. 이 경우, 이미지 선정부(250)는 후술하는 바와 같이, 각 문단별로 이미지를 선정할 수 있다.In addition, the
텍스트 DB(220)는 뉴스 수집부(210)에서 수집된 기사의 텍스트 전체를 저장하는 한편, 해당 기사 텍스트에 대응되도록 텍스트 가공부(240)로부터 입력된 키워드들을 연계시켜 저장할 수 있다.The
이미지 DB(230)는 다양한 키워드들에 대응되는 정지 영상 이미지 및 동영상들을 저장한다. 이미지 DB(230)는 인물, 뉴스 주제, 명사, 감정 별로 대응되는 이미지를 사전에 저장하고, 이미지 선정부(250)의 요청에 따라서 이미지들을 이미지 선정부(250)로 제공한다. 예컨대, 뉴스 텍스트로부터 특정 인물의 이름이 순위가 높은 키워드로서 추출되었다면, 해당 인물에 대해서 사전에 이미지 DB(230)에 저장된 이미지들이 이미지 선정부(250)로 제공될 수 있다.The image DB 230 stores still image images and moving images corresponding to various keywords. The image DB 230 stores images corresponding to each person, news topic, noun, and emotion in advance, and provides the images to the
음성 변환부(260)는 TTS (Text-to-Speech) 엔진으로 구현되어, 텍스트 가공부(240)로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부(270)로 출력한다. The
이 때, 본 발명의 음성 변환부(260)는 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리 데이터를 사전에 확보하여, 해당 인물들의 음성으로 뉴스 텍스트를 변환함으로써, 뉴스 소비자들로 하여금 해당 인물들이 뉴스를 읽어주는 듯한 느낌이 들도록 한다.At this time, the
또한, 본 발명의 음성 변환부(260)는 뉴스의 주제 및 내용(정치,경제,사회,문화,생활,의료,IT 등), 예상되는 뉴스의 주 소비 연령층, 뉴스의 분위기 등에 따라서, 뉴스를 읽어주는 음성의 성별, 연령대를 자동으로 설정하거나, 관리자 또는 사용자의 선택에 따라서 설정할 수 있다.In addition, the
이미지 선정부(250)는 텍스트 가공부(240)로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB(230)에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정한다.The
예컨대, 이미지 선정부(250)는 키워드들 중 가장 많이 반복되는 키워드가 연예인의 이름인 경우, 해당 뉴스가 해당 연예인에 대한 기사라고 판단하고, 특정 상품에 대한 키워드가 반복되는 경우에는 해당 제품에 대한 기사라고 판단하여, 해당 연예인과 해당 상품이 동시에 포함된 이미지가 존재하는지 여부를 이미지 DB(230)에 조회하고, 두 가지 조건을 모두 만족하는 이미지들이 존재하는 경우에는 해당 이미지들을 이미지 DB(230)로부터 판독하고, 두 가지 조건을 모두 만족하는 이미지가 존재하지 않는 경우에는 키워드 순위가 높은 인물에 대한 이미지들을 이미지 DB(230)로부터 판독한다.For example, the
이 때, 키워드에 대응되는 이미지가 이미지 DB(230)에 저장되어 있지 않은 경우에, 이미지 선정부(250)는 검색 엔진을 이용하여, 키워드에 대응되는 이미지를 확보하여 이미지 DB(230)에 저장하는 한편, 검색된 이미지들을 콘텐츠 생성부(270)로 출력할 수도 있다.At this time, if the image corresponding to the keyword is not stored in the
또한, 이미지 선정부(250)는 해당 기사의 키워드들과 일치하는 동영상 데이터가 이미지 DB(230)에 저장되어 있다면, 해당 동영상 데이터를 콘텐츠 생성부(270)로 출력할 수도 있다.In addition, if moving picture data matching the keywords of the article is stored in the
아울러, 상기 설명한 바와 같이, 텍스트 가공부(240)가 뉴스의 문단별로 키워드를 추출하여 이미지 선정부(250)로 출력한 경우에, 이미지 선정부(250)는 각 문단별로 대응되는 이미지를 이미지 DB(230)로부터 판독하거나 검색하고, 문단 순서대로 배치하여 해당 이미지들을 콘텐츠 생성부(270)로 출력한다.In addition, as described above, when the
한편, 콘텐츠 생성부(270)는 텍스트 가공부(240)로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 음성 변환부(260)로부터 입력된 음성 데이터와 동기화시킨다. 그리고, 콘텐츠 생성부(270)는 이미지 선정부(250)로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성한다. Meanwhile, the
콘텐츠 생성부(270)는 사전에 설정된 인트로 영상 및 종료 영상을, 최종 영상의 맨 처음과 맨 마지막에 배치하고, 이미지 선정부(250)로부터 입력된 이미지들을 최종 영상의 중간 부분에 배치한 후, 각 이미지마다 표시되는 시간을 설정함으로써 영상을 생성한다. 이 때, 콘텐츠 생성부(270)는 배치된 이미지와 기사 자막 내용 및 이를 읽는 음성 데이터가 서로 동기화 되도록 각 이미지가 표시되는 시간을 설정한다.The content generating
이 때, 콘텐츠 생성부(270)는 사전에 설정된 바에 따라서, 복수의 이미지들이 전환되는 순서, 이미지 전환 시간, 이미지 전환 효과 들을 추가하여 영상을 생성할 수 있다. 또한, 콘텐츠 생성부(270)는 사전에 설정된 특정 로고나 광고 배너 등을 영상에 포함시킬 수도 있다.In this case, the
마지막으로, 콘텐츠 생성부(270)는 자막, 음성 데이터, 및 영상을 상호 동기화시켜 결합함으로써 영상 뉴스 콘텐츠를 완성한다.Finally, the
이 때, 콘텐츠 생성부(270)는 원본 뉴스에 이미지가 삽입되어 있는 경우에, 이미지가 삽입된 원래 위치에 동영상 플레이어를 삽입하여 영상 뉴스 콘텐츠를 생성함으로써 원본 뉴스 콘텐츠와 최대한 동일성을 유지하도록 할 수 있고, 원본 뉴스에 이미지가 없는 경우에는, 헤드라인과 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 영상 뉴스를 생성할 수 있다. At this time, when the image is inserted in the original news, the
뉴스 콘텐츠 제공부(280)는 콘텐츠 생성부(270)로부터 입력된 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공함으로써, 뉴스 소비자들이 해당 언론사 서버 또는 인터넷 포털에 접속하여 영상 뉴스를 확인할 수 있도록 한다. 또한, 뉴스 콘텐츠 제공부(280)는 본 발명의 서비스를 제공받기 위한 앱을 설치한 사용자들의 이동통신 단말들로 뉴스 콘텐츠를 직접 제공할 수도 있다.The news
도 3은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법을 설명하는 흐름도이다.3 is a flowchart illustrating a video news generation method according to a preferred embodiment of the present invention.
도 3에 도시된 영상 뉴스 콘텐츠 생성 방법(이하, "영상 뉴스 생성 방법"으로 약칭함)은 상술한 영상 뉴스 생성 장치(200)에서 수행되는 것이므로, 그 기능이 실질적으로 동일하다. 따라서, 이하에서는 설명의 중복을 피하기 위해서, 상기 설명한 내용을 중심으로 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법의 흐름을 중심으로 설명한다. The video news content generating method (hereinafter, abbreviated as “video news generating method”) shown in FIG. 3 is performed by the above-described video
먼저, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)는 영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장함으로써 이미지 DB(230)를 구축한다(S310).First, the video
이미지 DB(230)는 다양한 키워드들에 대응되는 정지 영상 이미지 및 동영상들을 저장한다. 이미지 DB(230)는 인물, 뉴스 주제, 명사, 감정 별로 대응되는 이미지를 사전에 저장한다. 예컨대, 뉴스 텍스트로부터 특정 인물의 이름이 순위가 높은 키워드로서 추출되었다면, 해당 인물에 대해서 사전에 이미지 DB(230)에 저장된 이미지들이 영상 생성에 이용된다.The
그 후, 영상 뉴스 생성 장치(200)는 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털 등과 유무선 통신망을 통해서 상호 통신을 수행하여, API 방식으로 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집한다(S320).After that, the video
또한, 제 S320 단계에서, 영상 뉴스 생성 장치(200)는 일정한 시간 주기로 또는 실시간으로 웹 크롤링을 수행하여 텍스트 중심의 뉴스 콘텐츠를 수집할 수도 있다.Also, in step S320 , the video
뉴스 콘텐츠가 수집되면, 영상 뉴스 생성 장치(200)는 뉴스 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출한다(S330).When news content is collected, the video
이를 위해서, 영상 뉴스 생성 장치(200)는 먼저 뉴스 텍스트에서 규칙에 기반한 표기가 다른 단어들을 통합하고, 대문자 및 소문자를 통합하며, 불필요한 단어(예컨대, 불용어, 길이가 임계치를 초과하는 긴 단어 또는 임계치에 못 미치는 짧은 단어, 특수 문자 등)를 제거한다. To this end, the video
그리고, 영상 뉴스 생성 장치(200)는 명사에 붙는 조사들을 분리하여 명사 중심으로 키워드를 추출한다. 이 때, 성폭행, 범죄, 마약 등과 같이 부정적 의미를 나타내는 단어들은 배제하도록 처리될 수 있다. 또한, 영상 뉴스 생성 장치(200)는 추출된 명사들의 반복 횟수 등을 카운트하여 키워드의 순위를 설정할 수 있다. Then, the video
이 때, 키워드가 주어로 이용된 경우에는 가중치를 부여하여 동일한 횟수의 키워드라도 주어로 이용된 명사에 대해서 더 높은 키워드 순위가 부여되도록 할 수 있다. 또한, 영상 뉴스 생성 장치(200)는 각 문단별로 키워드를 추출할 수도 있다. 이 경우, 영상 뉴스 생성 장치(200)는 후술하는 바와 같이, 각 문단별로 이미지를 선정할 수 있다.In this case, when a keyword is used as a subject, a weight may be given to give a higher keyword ranking to a noun used as a subject even with the same number of keywords. Also, the video
그 후, 영상 뉴스 생성 장치(200)는 TTS (Text-to-Speech) 엔진을 이용하여, 뉴스 텍스트를 음성으로 변환한다(S340). Thereafter, the video
이 때, 본 발명의 영상 뉴스 생성 장치(200)는 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리 데이터를 사전에 확보하여, 해당 인물들의 음성으로 뉴스 텍스트를 변환함으로써, 뉴스 소비자들로 하여금 해당 인물들이 뉴스를 읽어주는 듯한 느낌이 들도록 한다.At this time, the video
또한, 본 발명의 영상 뉴스 생성 장치(200)는 뉴스의 주제 및 내용(정치,경제,사회,문화,생활,의료,IT 등), 예상되는 뉴스의 주 소비 연령층, 뉴스의 분위기 등에 따라서, 뉴스를 읽어주는 음성의 성별, 연령대를 자동으로 설정하거나, 관리자 또는 사용자의 선택에 따라서 설정할 수 있다.In addition, the video
영상 뉴스 생성 장치(200)는 뉴스 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB(230)에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정한다(S350).The video
예컨대, 영상 뉴스 생성 장치(200)는 키워드들 중 가장 많이 반복되는 키워드가 연예인의 이름인 경우, 해당 뉴스가 해당 연예인에 대한 기사라고 판단하고, 특정 상품에 대한 키워드가 반복되는 경우에는 해당 제품에 대한 기사라고 판단하여, 해당 연예인과 해당 상품이 동시에 포함된 이미지가 존재하는지 여부를 이미지 DB(230)에 조회하고, 두 가지 조건을 모두 만족하는 이미지들이 존재하는 경우에는 해당 이미지들을 이미지 DB(230)로부터 판독하고, 두 가지 조건을 모두 만족하는 이미지가 존재하지 않는 경우에는 키워드 순위가 높은 인물에 대한 이미지들을 이미지 DB(230)로부터 판독한다.For example, the video
이 때, 키워드에 대응되는 이미지가 이미지 DB(230)에 저장되어 있지 않은 경우에, 영상 뉴스 생성 장치(200)는 검색 엔진을 이용하여, 키워드에 대응되는 이미지를 확보할 수 있다.In this case, when the image corresponding to the keyword is not stored in the
제 S350 단계에서, 영상 뉴스 생성 장치(200)는 뉴스의 각 문단별로 대응되는 이미지를 이미지 DB(230)로부터 판독하거나 검색하고, 문단 순서대로 배치할 수 있다.In operation S350 , the video
한편, 영상 뉴스 생성 장치(200)는 뉴스 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키고, 제 S350 단계에서 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성한다(S360). On the other hand, the video
제 S360 단계에서, 영상 뉴스 생성 장치(200)는 사전에 설정된 인트로 영상 및 종료 영상을, 최종 영상의 맨 처음과 맨 마지막에 배치하고, 선정된 이미지들을 중간 부분에 배치한 후, 각 이미지마다 표시되는 시간을 설정함으로써 영상을 생성한다. 이 때, 영상 뉴스 생성 장치(200)는 배치된 이미지와 기사 자막 내용 및 이를 읽는 음성 데이터가 서로 동기화 되도록 각 이미지가 표시되는 시간을 설정한다.In step S360, the video
이 때, 영상 뉴스 생성 장치(200)는 사전에 설정된 바에 따라서, 복수의 이미지들이 전환되는 순서, 이미지 전환 시간, 이미지 전환 효과 들을 추가하여 영상을 생성할 수 있다. 또한, 영상 뉴스 생성 장치(200)는 사전에 설정된 특정 로고나 광고 배너 등을 영상에 포함시킬 수도 있다.In this case, the video
마지막으로, 영상 뉴스 생성 장치(200)는 자막, 음성 데이터, 및 영상을 상호 동기화시켜 결합함으로써 영상 뉴스 콘텐츠를 완성한다.Finally, the video
이 때, 영상 뉴스 생성 장치(200)는 원본 뉴스에 이미지가 삽입되어 있는 경우에, 이미지가 삽입된 원래 위치에 동영상 플레이어를 삽입하여 영상 뉴스 콘텐츠를 생성함으로써 원본 뉴스 콘텐츠와 최대한 동일성을 유지하도록 할 수 있고, 원본 뉴스에 이미지가 없는 경우에는, 헤드라인과 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 영상 뉴스를 생성할 수 있다. At this time, when an image is inserted in the original news, the video
마지막으로, 영상 뉴스 생성 장치(200)는 제 S360 단계에서 생성된 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공함으로써, 뉴스 소비자들이 해당 언론사 서버 또는 인터넷 포털에 접속하여 영상 뉴스를 확인할 수 있도록 한다. 또한, 영상 뉴스 생성 장치(200)는 본 발명의 서비스를 제공받기 위한 앱을 설치한 사용자들의 이동통신 단말들로 뉴스 콘텐츠를 직접 제공할 수도 있다.Finally, the video
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can also be implemented as computer-readable codes on a computer-readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data readable by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage device. In addition, the computer-readable recording medium is distributed in a computer system connected through a network, so that the computer-readable code can be stored and executed in a distributed manner.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far, with respect to the present invention, the preferred embodiments have been looked at. Those of ordinary skill in the art to which the present invention pertains will understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the disclosed embodiments are to be considered in an illustrative rather than a restrictive sense. The scope of the present invention is indicated in the claims rather than the foregoing description, and all differences within the scope equivalent thereto should be construed as being included in the present invention.
200 : 영상 뉴스 생성 장치
210 : 뉴스 수집부
220 : 텍스트 DB
230 : 이미지 DB
240 : 텍스트 가공부
250 : 이미지 선정부
260 : 음성 변환부
270 : 뉴스 콘텐츠 제공부200: video news generating device
210: news gathering department
220 : text DB
230 : image DB
240: text processing unit
250: image selection unit
260: voice conversion unit
270: news content provider
Claims (3)
상기 뉴스 수집부로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부, 이미지 선정부, 및 콘텐츠 생성부로 출력하는 텍스트 가공부;
상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부로 출력하는 음성 변환부;
상기 텍스트 가공부로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 이미지 선정부; 및
상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 상기 음성 변환부로부터 입력된 음성 데이터와 동기화시키고, 상기 이미지 선정부로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 콘텐츠 생성부를 포함하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 장치.a news collection unit for receiving and outputting text-oriented news content from a plurality of media servers or Internet portals;
a text processing unit for processing text included in the news article input from the news collecting unit and outputting it to a voice converting unit, an image selecting unit, and a content generating unit;
a speech conversion unit for converting the news text input from the text processing unit into speech and outputting the news text to the content generation unit;
an image selection unit for selecting images to be used in generating an image to be included in video news content from among images stored in an image DB using keywords of the article text input from the text processing unit; and
The news text input from the text processing unit is converted into subtitles, the subtitles are synchronized with the audio data input from the voice conversion unit, and the images input from the image selection unit are edited so that they are synchronized with the audio data and subtitles. and a content generator for generating video news content by generating the video and combining the generated video with subtitles and audio data.
영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장하는 단계;
일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집하는 단계;
상기 수집된 뉴스 콘텐츠의 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출하는 단계;
상기 수집된 뉴스 콘텐츠의 텍스트를 음성으로 변환하는 단계;
뉴스 콘텐츠의 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 단계;
뉴스 콘텐츠의 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키며, 상기 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 단계; 및
상기 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공하는 단계를 포함하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 방법.A method for generating video news content performed by an apparatus for generating video news content, the method comprising:
collecting and storing various images that can be used for video news content production;
Collecting news content by receiving text-oriented news from a plurality of media servers or Internet portals at regular time intervals or in real time;
After refining and normalizing the text of the collected news content, performing context analysis and morphological analysis to process the text and extract keywords;
converting the text of the collected news content into voice;
selecting images to be used in generating an image to be included in the image news content from among images stored in an image DB by using keywords extracted from the text of the news content;
Video news by converting text of news content into captions, synchronizing captions with audio data, editing the selected images to be synchronized with audio data and captions to create video, and combining the generated video with captions and audio data creating content; and
and providing the video news content to media company servers or Internet portals.
적어도 하나의 프로세서; 및
컴퓨터로 실행 가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되,
상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행 가능한 명령은, 상기 적어도 하나의 프로세서에 의해서, 상기 제 2 항의 각 단계가 실행되도록 하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 장치.A video news content generating device for generating video news content, the video news content generating device comprising:
at least one processor; and
at least one memory for storing computer-executable instructions;
The computer-executable instruction stored in the at least one memory causes each step of claim 2 to be executed by the at least one processor.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200055086A KR20210136609A (en) | 2020-05-08 | 2020-05-08 | Apparatus and method for generating image news contents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200055086A KR20210136609A (en) | 2020-05-08 | 2020-05-08 | Apparatus and method for generating image news contents |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210136609A true KR20210136609A (en) | 2021-11-17 |
Family
ID=78702469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200055086A KR20210136609A (en) | 2020-05-08 | 2020-05-08 | Apparatus and method for generating image news contents |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20210136609A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024111803A1 (en) * | 2022-11-21 | 2024-05-30 | 네오사피엔스 주식회사 | Method and system for generating real-time video content |
-
2020
- 2020-05-08 KR KR1020200055086A patent/KR20210136609A/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024111803A1 (en) * | 2022-11-21 | 2024-05-30 | 네오사피엔스 주식회사 | Method and system for generating real-time video content |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6429382B2 (en) | Content recommendation device and program | |
US8495062B2 (en) | System and method for generating search terms | |
US20110093343A1 (en) | System and Method of Content Generation | |
CN113536172B (en) | Encyclopedia information display method and device and computer storage medium | |
JP2020005309A (en) | Moving image editing server and program | |
WO2019245033A1 (en) | Moving image editing server and program | |
CN115357755B (en) | Video generation method, video display method and device | |
JP2020065307A (en) | Server, program, and moving image distribution system | |
JP2014153977A (en) | Content analysis device, content analysis method, content analysis program, and content reproduction system | |
Vidulin et al. | Multi-label approaches to web genre identification | |
KR20210136609A (en) | Apparatus and method for generating image news contents | |
JP6730760B2 (en) | Server and program, video distribution system | |
JP6603929B1 (en) | Movie editing server and program | |
JP2016081265A (en) | Picture selection device, picture selection method, picture selection program, characteristic-amount generation device, characteristic-amount generation method and characteristic-amount generation program | |
JP6903364B1 (en) | Server and data allocation method | |
KR20100090178A (en) | Apparatus and method refining keyword and contents searching system and method | |
JP6713183B1 (en) | Servers and programs | |
KR102368823B1 (en) | Apparatus and method for serving social content based on news articles | |
JP2011164865A (en) | Image-selecting device, image-selecting method, and image-selecting program | |
KR20210064620A (en) | The informatization method for youtube video metadata for personal media production | |
JP2020129357A (en) | Moving image editing server and program | |
JP2020201738A (en) | Information processing device and information processing program | |
JP6710884B2 (en) | Servers and programs | |
JP6533496B2 (en) | Description expression output device, explanation expression output method, and program | |
JP2024069065A (en) | Subtitle data generating device and subtitle data generating program |