KR20210136609A - 영상 뉴스 콘텐츠 생성 장치 및 방법 - Google Patents

영상 뉴스 콘텐츠 생성 장치 및 방법 Download PDF

Info

Publication number
KR20210136609A
KR20210136609A KR1020200055086A KR20200055086A KR20210136609A KR 20210136609 A KR20210136609 A KR 20210136609A KR 1020200055086 A KR1020200055086 A KR 1020200055086A KR 20200055086 A KR20200055086 A KR 20200055086A KR 20210136609 A KR20210136609 A KR 20210136609A
Authority
KR
South Korea
Prior art keywords
news
text
video
content
image
Prior art date
Application number
KR1020200055086A
Other languages
English (en)
Inventor
한경훈
Original Assignee
주식회사 인라이플
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 인라이플 filed Critical 주식회사 인라이플
Priority to KR1020200055086A priority Critical patent/KR20210136609A/ko
Publication of KR20210136609A publication Critical patent/KR20210136609A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 영상 뉴스 콘텐츠 생성 장치 및 방법을 제공한다. 본 발명은 단순한 텍스트 중심의 뉴스 콘텐츠를 API 또는 웹 크롤링 방식으로 언론사 서버 또는 인터넷 포털들로부터 수신하고, 해당 뉴스의 텍스트로부터 키워드를 추출하여 이에 대응되는 영상을 생성하여 뉴스 콘텐츠에 삽입하고, 해당 뉴스 텍스트를 음성으로 변환하여 뉴스 콘텐츠에 결합함으로써, 뉴스 소비자들의 집중도를 향상시키는 동시에, 뉴스 소비자들이 뉴스를 파악하는 수고를 감소시킴으로써, 뉴스 소비의 편의성과 효과를 증진시킬 수 있다. 이 때, 본 발명은 뉴스 텍스트를 음성으로 변환하는 과정에서, 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리를 이용함으로써, 뉴스 소비자들의 주목도, 친근감, 및 뉴스 전달력을 향상시킬 수 있다.

Description

영상 뉴스 콘텐츠 생성 장치 및 방법{Apparatus and method for generating image news contents}
본 발명은 뉴스 콘텐츠 생성 장치 및 방법에 관한 것으로서, 보다 구체적으로는 영상 뉴스 콘텐츠 생성 및 방법에 관한 것이다.
최근 언론사에서 제공하는 뉴스 서비스는 텍스트와 사진이 포함된 뉴스를 언론사 홈페이지 또는 인터넷 포털에 게재하고, 소비자들이 자신의 통신 단말을 통해서 언론사 서버 또는 인터넷 포털에 접속하여 뉴스를 확인하는 방식으로 제공된다.
이러한 종래의 뉴스 서비스는 작은 텍스트를 일일이 뉴스 소비자들이 읽어야 하는 불편함이 있고, 뉴스에 포함된 사진 역시 단 하나의 사진으로 한정되므로 소비자들의 주목을 끌지 못하는 단점이 있다.
이러한 단점을 해소하기 위해서, 최근 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 뉴스 동영상을 제공하는 서비스가 제공되고 있으나, 이러한 뉴스 동영상은 해당 뉴스를 전달하기 위해서 오프라인상에서 언론사가 실제 제작하여 제공하는 것으로서, 실제 동영상 뉴스를 제작하는 방송사 등은 이러한 뉴스 서비스가 가능하지만, 텍스트 중심의 뉴스를 생산하는 신문사와 같은 언론사들은 이러한 서비스를 제공할 수 없는 문제점이 존재한다.
본 발명이 해결하고자 하는 과제는 단순한 텍스트 중심의 뉴스 콘텐츠에, 뉴스 소비자들이 집중하면서도 추가적인 정보를 제공할 수 있도록 영상을 삽입하고, 사용자들이 뉴스 텍스트를 직접 읽지 않아도 뉴스를 파악할 수 있도록 음성을 합성한 뉴스 콘텐츠를 생성하고 제공하는 것이다.
상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 장치는, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스 콘텐츠를 수신하여 출력하는 뉴스 수집부; 상기 뉴스 수집부로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부, 이미지 선정부, 및 콘텐츠 생성부로 출력하는 텍스트 가공부; 상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부로 출력하는 음성 변환부; 상기 텍스트 가공부로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 이미지 선정부; 및 상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 상기 음성 변환부로부터 입력된 음성 데이터와 동기화시키고, 상기 이미지 선정부로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 콘텐츠 생성부를 포함한다.
한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 방법은, 영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장하는 단계; 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집하는 단계; 상기 수집된 뉴스 콘텐츠의 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출하는 단계; 상기 수집된 뉴스 콘텐츠의 텍스트를 음성으로 변환하는 단계; 뉴스 콘텐츠의 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 단계; 뉴스 콘텐츠의 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키며, 상기 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 단계; 및 상기 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공하는 단계를 포함한다.
한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 영상 뉴스 콘텐츠 생성 장치는, 적어도 하나의 프로세서; 및 컴퓨터로 실행 가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되, 상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행 가능한 명령은, 상기 적어도 하나의 프로세서에 의해서, 상기 영상 뉴스 콘텐츠 생성 방법의 각 단계가 실행되도록 하는 것을 특징으로 한다.
본 발명은 단순한 텍스트 중심의 뉴스 콘텐츠를 API 또는 웹 크롤링 방식으로 언론사 서버 또는 인터넷 포털들로부터 수신하고, 해당 뉴스의 텍스트로부터 키워드를 추출하여 이에 대응되는 영상을 생성하여 뉴스 콘텐츠에 삽입하고, 해당 뉴스 텍스트를 음성으로 변환하여 뉴스 콘텐츠에 결합함으로써, 뉴스 소비자들의 집중도를 향상시키는 동시에, 뉴스 소비자들이 뉴스를 파악하는 수고를 감소시킴으로써, 뉴스 소비의 편의성과 효과를 증진시킬 수 있다.
이 때, 본 발명은 뉴스 텍스트를 음성으로 변환하는 과정에서, 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리를 이용함으로써, 뉴스 소비자들의 주목도, 친근감, 및 뉴스 전달력을 향상시킬 수 있다.
도 1은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치가 본 발명의 서비스를 제공하기 위한 전체 구성들 간의 관계를 도시하는 도면이다.
도 2는 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치의 세부 구성을 도시하는 도면이다.
도 3은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법을 설명하는 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 영상 영상 뉴스 생성 장치가 본 발명의 서비스를 제공하기 위한 전체 구성들 간의 관계를 도시하는 도면이다.
도 1을 참조하면, 본 발명의 영상 뉴스 콘텐츠 생성 장치(200)(이하, "영상 뉴스 생성 장치"로 약칭함)는 유무선 통신망을 통해서 복수의 언론서 서버들과 연결되어 언론사 서버들(110-1~110-N)로부터 텍스트 중심의 뉴스 콘텐츠를 일정한 시간 주기 또는 실시간으로 수집한다. 또한, 본 발명의 영상 뉴스 생성 장치(200)는 복수의 언론사 서버(110-1~110-N)가 인터넷 포털(120-1~120-N) 등에 게시한 뉴스 콘텐츠를 수집할 수도 있다.
또한, 본 발명의 영상 뉴스 생성 장치(200)는 생성된 영상 뉴스 콘텐츠를 유무선 통신망을 통해서 언론사 서버들 또는 인터넷 포털 등으로 제공할 수 있다.
한편, 본 발명의 영상 뉴스 생성 장치(200)는 유무선 통신망을 통해서 뉴스 소비자인 사용자 단말들과 연결되어, 영상 뉴스 생성 장치(200)에서 생성된 영상 뉴스 콘텐츠를 사용자 단말들로 직접 제공할 수도 있다.
도 2는 본 발명의 바람직한 실시예에 따른 영상 영상 뉴스 생성 장치(200)의 세부 구성을 도시하는 도면이다.
도 2를 참조하여, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)의 세부 구성에 대해서 설명하면, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)는 뉴스 수집부(210), 텍스트 DB(220), 이미지 DB(230), 텍스트 가공부(240), 이미지 선정부(250), 음성 변환부(260), 콘텐츠 생성부(270), 및 뉴스 콘텐츠 제공부(280)를 포함하여 구성된다.
먼저, 뉴스 수집부(210)는 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털 등과 유무선 통신망을 통해서 상호 통신을 수행하여, API 방식으로 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스 콘텐츠를 수신하여 텍스트 가공부(240)로 출력한다.
또한, 뉴스 수집부(210)는 일정한 시간 주기로 또는 실시간으로 웹 크롤링을 수행하여 텍스트 중심의 뉴스 콘텐츠를 수집하고, 수집된 뉴스 콘텐츠를 텍스트 가공부(240)로 출력한다.
텍스트 가공부(240)는 뉴스 수집부(210)로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부(260), 이미지 선정부(250), 및 콘텐츠 생성부(270)로 출력한다. 또한, 텍스트 가공부(240)는 뉴스 수집부(210)로부터 입력된 뉴스 텍스트 및 가공된 뉴스 텍스트를 텍스트 DB(220)로 출력하여 저장할 수 있다.
먼저, 텍스트 가공부(240)는 입력된 뉴스 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 키워드를 추출한다.
이를 위해서, 텍스트 가공부(240)는 먼저 뉴스 텍스트에서 규칙에 기반한 표기가 다른 단어들을 통합하고, 대문자 및 소문자를 통합하며, 불필요한 단어(예컨대, 불용어, 길이가 임계치를 초과하는 긴 단어 또는 임계치에 못 미치는 짧은 단어, 특수 문자 등)를 제거한다.
그리고, 텍스트 가공부(240)는 명사에 붙는 조사들을 분리하여 명사 중심으로 키워드를 추출한다. 이 때, 성폭행, 범죄, 마약 등을 나타내는 단어들은 배제하도록 처리될 수 있다. 또한, 텍스트 가공부(240)는 추출된 명사들의 반복 횟수 등을 카운트하여 키워드의 순위를 설정하여 출력할 수 있다. 이 때, 키워드가 주어로 이용된 경우에는 가중치를 부여하여 동일한 횟수의 키워드라도 주어로 이용된 명사에 대해서 더 높은 키워드 순위가 부여되도록 할 수 있다. 또한, 텍스트 가공부(240)는 각 문단별로 키워드를 추출하여 이미지 선정부(250)로 출력할 수도 있다. 이 경우, 이미지 선정부(250)는 후술하는 바와 같이, 각 문단별로 이미지를 선정할 수 있다.
텍스트 DB(220)는 뉴스 수집부(210)에서 수집된 기사의 텍스트 전체를 저장하는 한편, 해당 기사 텍스트에 대응되도록 텍스트 가공부(240)로부터 입력된 키워드들을 연계시켜 저장할 수 있다.
이미지 DB(230)는 다양한 키워드들에 대응되는 정지 영상 이미지 및 동영상들을 저장한다. 이미지 DB(230)는 인물, 뉴스 주제, 명사, 감정 별로 대응되는 이미지를 사전에 저장하고, 이미지 선정부(250)의 요청에 따라서 이미지들을 이미지 선정부(250)로 제공한다. 예컨대, 뉴스 텍스트로부터 특정 인물의 이름이 순위가 높은 키워드로서 추출되었다면, 해당 인물에 대해서 사전에 이미지 DB(230)에 저장된 이미지들이 이미지 선정부(250)로 제공될 수 있다.
음성 변환부(260)는 TTS (Text-to-Speech) 엔진으로 구현되어, 텍스트 가공부(240)로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부(270)로 출력한다.
이 때, 본 발명의 음성 변환부(260)는 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리 데이터를 사전에 확보하여, 해당 인물들의 음성으로 뉴스 텍스트를 변환함으로써, 뉴스 소비자들로 하여금 해당 인물들이 뉴스를 읽어주는 듯한 느낌이 들도록 한다.
또한, 본 발명의 음성 변환부(260)는 뉴스의 주제 및 내용(정치,경제,사회,문화,생활,의료,IT 등), 예상되는 뉴스의 주 소비 연령층, 뉴스의 분위기 등에 따라서, 뉴스를 읽어주는 음성의 성별, 연령대를 자동으로 설정하거나, 관리자 또는 사용자의 선택에 따라서 설정할 수 있다.
이미지 선정부(250)는 텍스트 가공부(240)로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB(230)에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정한다.
예컨대, 이미지 선정부(250)는 키워드들 중 가장 많이 반복되는 키워드가 연예인의 이름인 경우, 해당 뉴스가 해당 연예인에 대한 기사라고 판단하고, 특정 상품에 대한 키워드가 반복되는 경우에는 해당 제품에 대한 기사라고 판단하여, 해당 연예인과 해당 상품이 동시에 포함된 이미지가 존재하는지 여부를 이미지 DB(230)에 조회하고, 두 가지 조건을 모두 만족하는 이미지들이 존재하는 경우에는 해당 이미지들을 이미지 DB(230)로부터 판독하고, 두 가지 조건을 모두 만족하는 이미지가 존재하지 않는 경우에는 키워드 순위가 높은 인물에 대한 이미지들을 이미지 DB(230)로부터 판독한다.
이 때, 키워드에 대응되는 이미지가 이미지 DB(230)에 저장되어 있지 않은 경우에, 이미지 선정부(250)는 검색 엔진을 이용하여, 키워드에 대응되는 이미지를 확보하여 이미지 DB(230)에 저장하는 한편, 검색된 이미지들을 콘텐츠 생성부(270)로 출력할 수도 있다.
또한, 이미지 선정부(250)는 해당 기사의 키워드들과 일치하는 동영상 데이터가 이미지 DB(230)에 저장되어 있다면, 해당 동영상 데이터를 콘텐츠 생성부(270)로 출력할 수도 있다.
아울러, 상기 설명한 바와 같이, 텍스트 가공부(240)가 뉴스의 문단별로 키워드를 추출하여 이미지 선정부(250)로 출력한 경우에, 이미지 선정부(250)는 각 문단별로 대응되는 이미지를 이미지 DB(230)로부터 판독하거나 검색하고, 문단 순서대로 배치하여 해당 이미지들을 콘텐츠 생성부(270)로 출력한다.
한편, 콘텐츠 생성부(270)는 텍스트 가공부(240)로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 음성 변환부(260)로부터 입력된 음성 데이터와 동기화시킨다. 그리고, 콘텐츠 생성부(270)는 이미지 선정부(250)로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성한다.
콘텐츠 생성부(270)는 사전에 설정된 인트로 영상 및 종료 영상을, 최종 영상의 맨 처음과 맨 마지막에 배치하고, 이미지 선정부(250)로부터 입력된 이미지들을 최종 영상의 중간 부분에 배치한 후, 각 이미지마다 표시되는 시간을 설정함으로써 영상을 생성한다. 이 때, 콘텐츠 생성부(270)는 배치된 이미지와 기사 자막 내용 및 이를 읽는 음성 데이터가 서로 동기화 되도록 각 이미지가 표시되는 시간을 설정한다.
이 때, 콘텐츠 생성부(270)는 사전에 설정된 바에 따라서, 복수의 이미지들이 전환되는 순서, 이미지 전환 시간, 이미지 전환 효과 들을 추가하여 영상을 생성할 수 있다. 또한, 콘텐츠 생성부(270)는 사전에 설정된 특정 로고나 광고 배너 등을 영상에 포함시킬 수도 있다.
마지막으로, 콘텐츠 생성부(270)는 자막, 음성 데이터, 및 영상을 상호 동기화시켜 결합함으로써 영상 뉴스 콘텐츠를 완성한다.
이 때, 콘텐츠 생성부(270)는 원본 뉴스에 이미지가 삽입되어 있는 경우에, 이미지가 삽입된 원래 위치에 동영상 플레이어를 삽입하여 영상 뉴스 콘텐츠를 생성함으로써 원본 뉴스 콘텐츠와 최대한 동일성을 유지하도록 할 수 있고, 원본 뉴스에 이미지가 없는 경우에는, 헤드라인과 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 영상 뉴스를 생성할 수 있다.
뉴스 콘텐츠 제공부(280)는 콘텐츠 생성부(270)로부터 입력된 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공함으로써, 뉴스 소비자들이 해당 언론사 서버 또는 인터넷 포털에 접속하여 영상 뉴스를 확인할 수 있도록 한다. 또한, 뉴스 콘텐츠 제공부(280)는 본 발명의 서비스를 제공받기 위한 앱을 설치한 사용자들의 이동통신 단말들로 뉴스 콘텐츠를 직접 제공할 수도 있다.
도 3은 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법을 설명하는 흐름도이다.
도 3에 도시된 영상 뉴스 콘텐츠 생성 방법(이하, "영상 뉴스 생성 방법"으로 약칭함)은 상술한 영상 뉴스 생성 장치(200)에서 수행되는 것이므로, 그 기능이 실질적으로 동일하다. 따라서, 이하에서는 설명의 중복을 피하기 위해서, 상기 설명한 내용을 중심으로 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 방법의 흐름을 중심으로 설명한다.
먼저, 본 발명의 바람직한 실시예에 따른 영상 뉴스 생성 장치(200)는 영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장함으로써 이미지 DB(230)를 구축한다(S310).
이미지 DB(230)는 다양한 키워드들에 대응되는 정지 영상 이미지 및 동영상들을 저장한다. 이미지 DB(230)는 인물, 뉴스 주제, 명사, 감정 별로 대응되는 이미지를 사전에 저장한다. 예컨대, 뉴스 텍스트로부터 특정 인물의 이름이 순위가 높은 키워드로서 추출되었다면, 해당 인물에 대해서 사전에 이미지 DB(230)에 저장된 이미지들이 영상 생성에 이용된다.
그 후, 영상 뉴스 생성 장치(200)는 일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털 등과 유무선 통신망을 통해서 상호 통신을 수행하여, API 방식으로 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집한다(S320).
또한, 제 S320 단계에서, 영상 뉴스 생성 장치(200)는 일정한 시간 주기로 또는 실시간으로 웹 크롤링을 수행하여 텍스트 중심의 뉴스 콘텐츠를 수집할 수도 있다.
뉴스 콘텐츠가 수집되면, 영상 뉴스 생성 장치(200)는 뉴스 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출한다(S330).
이를 위해서, 영상 뉴스 생성 장치(200)는 먼저 뉴스 텍스트에서 규칙에 기반한 표기가 다른 단어들을 통합하고, 대문자 및 소문자를 통합하며, 불필요한 단어(예컨대, 불용어, 길이가 임계치를 초과하는 긴 단어 또는 임계치에 못 미치는 짧은 단어, 특수 문자 등)를 제거한다.
그리고, 영상 뉴스 생성 장치(200)는 명사에 붙는 조사들을 분리하여 명사 중심으로 키워드를 추출한다. 이 때, 성폭행, 범죄, 마약 등과 같이 부정적 의미를 나타내는 단어들은 배제하도록 처리될 수 있다. 또한, 영상 뉴스 생성 장치(200)는 추출된 명사들의 반복 횟수 등을 카운트하여 키워드의 순위를 설정할 수 있다.
이 때, 키워드가 주어로 이용된 경우에는 가중치를 부여하여 동일한 횟수의 키워드라도 주어로 이용된 명사에 대해서 더 높은 키워드 순위가 부여되도록 할 수 있다. 또한, 영상 뉴스 생성 장치(200)는 각 문단별로 키워드를 추출할 수도 있다. 이 경우, 영상 뉴스 생성 장치(200)는 후술하는 바와 같이, 각 문단별로 이미지를 선정할 수 있다.
그 후, 영상 뉴스 생성 장치(200)는 TTS (Text-to-Speech) 엔진을 이용하여, 뉴스 텍스트를 음성으로 변환한다(S340).
이 때, 본 발명의 영상 뉴스 생성 장치(200)는 유명 연예인, 유명 성우, 유명 쇼호스트들의 목소리 데이터를 사전에 확보하여, 해당 인물들의 음성으로 뉴스 텍스트를 변환함으로써, 뉴스 소비자들로 하여금 해당 인물들이 뉴스를 읽어주는 듯한 느낌이 들도록 한다.
또한, 본 발명의 영상 뉴스 생성 장치(200)는 뉴스의 주제 및 내용(정치,경제,사회,문화,생활,의료,IT 등), 예상되는 뉴스의 주 소비 연령층, 뉴스의 분위기 등에 따라서, 뉴스를 읽어주는 음성의 성별, 연령대를 자동으로 설정하거나, 관리자 또는 사용자의 선택에 따라서 설정할 수 있다.
영상 뉴스 생성 장치(200)는 뉴스 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB(230)에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정한다(S350).
예컨대, 영상 뉴스 생성 장치(200)는 키워드들 중 가장 많이 반복되는 키워드가 연예인의 이름인 경우, 해당 뉴스가 해당 연예인에 대한 기사라고 판단하고, 특정 상품에 대한 키워드가 반복되는 경우에는 해당 제품에 대한 기사라고 판단하여, 해당 연예인과 해당 상품이 동시에 포함된 이미지가 존재하는지 여부를 이미지 DB(230)에 조회하고, 두 가지 조건을 모두 만족하는 이미지들이 존재하는 경우에는 해당 이미지들을 이미지 DB(230)로부터 판독하고, 두 가지 조건을 모두 만족하는 이미지가 존재하지 않는 경우에는 키워드 순위가 높은 인물에 대한 이미지들을 이미지 DB(230)로부터 판독한다.
이 때, 키워드에 대응되는 이미지가 이미지 DB(230)에 저장되어 있지 않은 경우에, 영상 뉴스 생성 장치(200)는 검색 엔진을 이용하여, 키워드에 대응되는 이미지를 확보할 수 있다.
제 S350 단계에서, 영상 뉴스 생성 장치(200)는 뉴스의 각 문단별로 대응되는 이미지를 이미지 DB(230)로부터 판독하거나 검색하고, 문단 순서대로 배치할 수 있다.
한편, 영상 뉴스 생성 장치(200)는 뉴스 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키고, 제 S350 단계에서 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성한다(S360).
제 S360 단계에서, 영상 뉴스 생성 장치(200)는 사전에 설정된 인트로 영상 및 종료 영상을, 최종 영상의 맨 처음과 맨 마지막에 배치하고, 선정된 이미지들을 중간 부분에 배치한 후, 각 이미지마다 표시되는 시간을 설정함으로써 영상을 생성한다. 이 때, 영상 뉴스 생성 장치(200)는 배치된 이미지와 기사 자막 내용 및 이를 읽는 음성 데이터가 서로 동기화 되도록 각 이미지가 표시되는 시간을 설정한다.
이 때, 영상 뉴스 생성 장치(200)는 사전에 설정된 바에 따라서, 복수의 이미지들이 전환되는 순서, 이미지 전환 시간, 이미지 전환 효과 들을 추가하여 영상을 생성할 수 있다. 또한, 영상 뉴스 생성 장치(200)는 사전에 설정된 특정 로고나 광고 배너 등을 영상에 포함시킬 수도 있다.
마지막으로, 영상 뉴스 생성 장치(200)는 자막, 음성 데이터, 및 영상을 상호 동기화시켜 결합함으로써 영상 뉴스 콘텐츠를 완성한다.
이 때, 영상 뉴스 생성 장치(200)는 원본 뉴스에 이미지가 삽입되어 있는 경우에, 이미지가 삽입된 원래 위치에 동영상 플레이어를 삽입하여 영상 뉴스 콘텐츠를 생성함으로써 원본 뉴스 콘텐츠와 최대한 동일성을 유지하도록 할 수 있고, 원본 뉴스에 이미지가 없는 경우에는, 헤드라인과 뉴스 텍스트 사이에 동영상 플레이어를 삽입하여 영상 뉴스를 생성할 수 있다.
마지막으로, 영상 뉴스 생성 장치(200)는 제 S360 단계에서 생성된 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공함으로써, 뉴스 소비자들이 해당 언론사 서버 또는 인터넷 포털에 접속하여 영상 뉴스를 확인할 수 있도록 한다. 또한, 영상 뉴스 생성 장치(200)는 본 발명의 서비스를 제공받기 위한 앱을 설치한 사용자들의 이동통신 단말들로 뉴스 콘텐츠를 직접 제공할 수도 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
200 : 영상 뉴스 생성 장치
210 : 뉴스 수집부
220 : 텍스트 DB
230 : 이미지 DB
240 : 텍스트 가공부
250 : 이미지 선정부
260 : 음성 변환부
270 : 뉴스 콘텐츠 제공부

Claims (3)

  1. 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스 콘텐츠를 수신하여 출력하는 뉴스 수집부;
    상기 뉴스 수집부로부터 입력된 뉴스 기사에 포함된 텍스트를 가공하여 음성 변환부, 이미지 선정부, 및 콘텐츠 생성부로 출력하는 텍스트 가공부;
    상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 음성으로 변환하여 콘텐츠 생성부로 출력하는 음성 변환부;
    상기 텍스트 가공부로부터 입력된 기사 텍스트의 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 이미지 선정부; 및
    상기 텍스트 가공부로부터 입력된 뉴스 텍스트를 자막으로 변환하고, 자막을 상기 음성 변환부로부터 입력된 음성 데이터와 동기화시키고, 상기 이미지 선정부로부터 입력된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 콘텐츠 생성부를 포함하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 장치.
  2. 영상 뉴스 콘텐츠 생성 장치에서 수행되는 영상 뉴스 콘텐츠 생성 방법으로서,
    영상 뉴스 콘텐츠 제작에 이용할 수 있는 다양한 이미지들을 수집하여 저장하는 단계;
    일정한 시간 주기로 또는 실시간으로, 복수의 언론사 서버 또는 인터넷 포털로부터 텍스트 중심의 뉴스를 수신함으로써 뉴스 콘텐츠를 수집하는 단계;
    상기 수집된 뉴스 콘텐츠의 텍스트를 정제 및 정규화한 후, 문맥 분석 및 형태소 분석을 수행하여 텍스트를 가공하고 키워드를 추출하는 단계;
    상기 수집된 뉴스 콘텐츠의 텍스트를 음성으로 변환하는 단계;
    뉴스 콘텐츠의 텍스트에서 추출된 키워드들을 이용하여, 이미지 DB에 저장된 이미지들 중 영상 뉴스 콘텐츠에 포함될 영상의 생성에 이용될 이미지들을 선정하는 단계;
    뉴스 콘텐츠의 텍스트를 자막으로 변환하고, 자막을 음성 데이터와 동기화시키며, 상기 선정된 이미지들이 음성 데이터 및 자막과 동기화되도록 편집하여 영상을 생성하고, 생성된 영상을 자막 및 음성 데이터와 결합함으로써 영상 뉴스 콘텐츠를 생성하는 단계; 및
    상기 영상 뉴스 콘텐츠를 언론사 서버들 또는 인터넷 포털들로 제공하는 단계를 포함하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 방법.
  3. 영상 뉴스 콘텐츠를 생성하는 영상 뉴스 콘텐츠 생성 장치로서, 상기 영상 뉴스 콘텐츠 생성 장치는
    적어도 하나의 프로세서; 및
    컴퓨터로 실행 가능한 명령을 저장하는 적어도 하나의 메모리를 포함하되,
    상기 적어도 하나의 메모리에 저장된 상기 컴퓨터로 실행 가능한 명령은, 상기 적어도 하나의 프로세서에 의해서, 상기 제 2 항의 각 단계가 실행되도록 하는 것을 특징으로 하는 영상 뉴스 콘텐츠 생성 장치.
KR1020200055086A 2020-05-08 2020-05-08 영상 뉴스 콘텐츠 생성 장치 및 방법 KR20210136609A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200055086A KR20210136609A (ko) 2020-05-08 2020-05-08 영상 뉴스 콘텐츠 생성 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200055086A KR20210136609A (ko) 2020-05-08 2020-05-08 영상 뉴스 콘텐츠 생성 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20210136609A true KR20210136609A (ko) 2021-11-17

Family

ID=78702469

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200055086A KR20210136609A (ko) 2020-05-08 2020-05-08 영상 뉴스 콘텐츠 생성 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20210136609A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024111803A1 (ko) * 2022-11-21 2024-05-30 네오사피엔스 주식회사 실시간 영상 콘텐츠 생성 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024111803A1 (ko) * 2022-11-21 2024-05-30 네오사피엔스 주식회사 실시간 영상 콘텐츠 생성 방법 및 시스템

Similar Documents

Publication Publication Date Title
JP6429382B2 (ja) コンテンツ推薦装置、及びプログラム
US8495062B2 (en) System and method for generating search terms
US20110093343A1 (en) System and Method of Content Generation
CN113536172B (zh) 一种百科信息展示的方法、装置及计算机存储介质
JP2020005309A (ja) 動画編集サーバおよびプログラム
WO2019245033A1 (ja) 動画編集サーバおよびプログラム
CN115357755B (zh) 视频生成方法、视频展示方法和装置
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム
JP6446987B2 (ja) 映像選択装置、映像選択方法、映像選択プログラム、特徴量生成装置、特徴量生成方法及び特徴量生成プログラム
Vidulin et al. Multi-label approaches to web genre identification
KR20210136609A (ko) 영상 뉴스 콘텐츠 생성 장치 및 방법
JP6730760B2 (ja) サーバおよびプログラム、動画配信システム
JP6603929B1 (ja) 動画編集サーバおよびプログラム
JP6903364B1 (ja) サーバおよびデータ割り当て方法
KR20100090178A (ko) 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법
JP6713183B1 (ja) サーバおよびプログラム
KR102368823B1 (ko) 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법
JP2011164865A (ja) 画像選定装置、画像選定方法および画像選定プログラム
KR20210064620A (ko) 개인 미디어 제작을 위한 유튜브 동영상 메타데이터 취득 및 정보화 방법
JP2020129357A (ja) 動画編集サーバおよびプログラム
JP2020201738A (ja) 情報処理装置及び情報処理プログラム
JP6533496B2 (ja) 説明表現出力装置、説明表現出力方法、及びプログラム
JP2020065308A (ja) サーバおよびプログラム
JP2024069065A (ja) 字幕データ生成装置及び字幕データ生成プログラム
CN113569064A (zh) 多媒体列表的名称生成方法和装置