KR101742779B1 - 음성인식형 입체적 디지털영상 구현시스템 - Google Patents

음성인식형 입체적 디지털영상 구현시스템 Download PDF

Info

Publication number
KR101742779B1
KR101742779B1 KR1020150066329A KR20150066329A KR101742779B1 KR 101742779 B1 KR101742779 B1 KR 101742779B1 KR 1020150066329 A KR1020150066329 A KR 1020150066329A KR 20150066329 A KR20150066329 A KR 20150066329A KR 101742779 B1 KR101742779 B1 KR 101742779B1
Authority
KR
South Korea
Prior art keywords
text information
module
voice
information
voice recognition
Prior art date
Application number
KR1020150066329A
Other languages
English (en)
Other versions
KR20160133335A (ko
Inventor
이석희
김건우
Original Assignee
이석희
김건우
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이석희, 김건우 filed Critical 이석희
Priority to KR1020150066329A priority Critical patent/KR101742779B1/ko
Publication of KR20160133335A publication Critical patent/KR20160133335A/ko
Application granted granted Critical
Publication of KR101742779B1 publication Critical patent/KR101742779B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Devices (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 음성인식형 입체적 디지털영상 구현시스템을 제공한다. 이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 음성인식을 통해 자동으로 생성되는 음성기반 텍스트정보가 영상프레임 내부에 표기되도록 함으로써 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현될 수 있으며, 다양한 편집기능이 제공되어 사용자의 편의 향상과 다이나믹한 영상프레임 구현이 가능해지는 한편, 인식된 음성정보를 실시간 확인하여 유효하지 않은 음성정보가 인식되거나 음성정보 인식오류가 발생될 경우 음성인식과 음성기반 텍스트정보의 생성이 재실행될 수 있도록 하고, 필요에 따라 촬영자의 음성과 피사체의 음성 중 어느 하나가 선택적으로 인식될 수 있도록 함으로써 음성인식의 기능성이 향상되며, 음성기반 텍스트정보 이외에 미리 설정되어 있는 기본제공 텍스트정보나 사용자에 의해 입력되는 직접입력 텍스트정보도 영상프레임 내부에 표기될 수 있도록 함으로써 사용자의 선택 폭이 넓어지고 텍스트정보의 표기가 다변화될 수 있는 기술적 특징을 갖는다.
본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 외부의 음성을 인식하는 음성인식모듈(10a)과; 음성인식모듈(10a)로부터 인식된 음성정보를 텍스트정보로 변환하여 음성기반 텍스트정보를 생성시키는 정보변환모듈(20)과; 영상프레임 내부에 표기되는 텍스트정보에 대한 특성정보와 편집정보를 설정하는 텍스트정보 표기 설정모듈(30a)과; 피사체를 촬영하여 영상프레임을 생성시키는 촬영모듈(40)과; 사용자에 의해 음성인식모듈(10a)의 활성화 유무가 선택되도록 하는 음성인식모듈 활성화 관리모듈(10b)과; 음성인식모듈(10a)이 활성화될 경우, 텍스트정보 표기 설정모듈(30a)로부터 설정된 텍스트정보에 대한 특성정보와 편집정보에 맞추어 촬영모듈(40)로부터 생성된 영상프레임에 음성기반 텍스트정보가 표기되도록 하는 텍스트정보 표시 관리모듈(30b) 및; 텍스트정보가 표기된 영상프레임인 편집완료 영상프레임을 저장하고 관리하는 편집완료 영상프레임 관리모듈(30c)을 포함하는 구성으로 이루어진다.

Description

음성인식형 입체적 디지털영상 구현시스템{System for making dynamic digital image by voice recognition}
본 발명은 음성인식형 입체적 디지털영상 구현시스템에 관한 것으로, 좀더 구체적으로는 음성인식을 통해 자동으로 생성되는 음성기반 텍스트정보가 영상프레임 내부에 표기되도록 함으로써 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현될 수 있으며, 다양한 편집기능이 제공되어 사용자의 편의 향상과 다이나믹한 영상프레임 구현이 가능해지는 한편, 인식된 음성정보를 실시간 확인하여 유효하지 않은 음성정보가 인식되거나 음성정보 인식오류가 발생될 경우 음성인식과 음성기반 텍스트정보의 생성이 재실행될 수 있도록 하고, 필요에 따라 촬영자의 음성과 피사체의 음성 중 어느 하나가 선택적으로 인식될 수 있도록 함으로써 음성인식의 기능성이 향상되며, 음성기반 텍스트정보 이외에 미리 설정되어 있는 기본제공 텍스트정보나 사용자에 의해 입력되는 직접입력 텍스트정보도 영상프레임 내부에 표기될 수 있도록 함으로써 사용자의 선택 폭이 넓어지고 텍스트정보의 표기가 다변화될 수 있는 음성인식형 입체적 디지털영상 구현시스템에 관한 것이다.
최근 광학기술 및 전자산업의 급격한 발달로 새로운 종류의 디지털 기기들이 대량으로 출현하고 있고, 종래의 카메라 및 휴대폰 등도 새로운 개념으로 발전하고 있다. 예를 들어, 종래의 카메라는 빛을 이용하여 촬상한 이미지를 기록하고, 현상 및 인화하는 과정을 거친 후에 촬상한 이미지를 볼 수 있다.
이에 대해, 디지털 카메라(또는 DSLR)는 사진을 찍은 후 복잡한 현상 및 인화 과정을 거치는 것이 아니라 화면을 카메라에 내장된 디지털 저장 매체에 저장하고, 모니터 또는 프린터를 이용하여 출력함으로써 손쉽게 촬상한 영상을 확인할 수 있다. 이러한 디지털 카메라는 종래의 카메라와 스캐너의 역할을 대체할 수 있고, PC의 화상 데이터와 호환성이 높아 편집 및 수정을 간편하게 할 수 있다는 장점을 갖는다. 그러나 이러한 디지털 카메라는 시간이 지난 후에 영상의 촬영장소, 촬영시의 느낌 및 동행인 등과 같이 촬영한 시점의 구체적 상황을 촬영된 영상만으로는 쉽게 기억할 수 없다는 문제점을 갖는다.
한편 휴대폰은 피처폰에서 스마트폰 등과 같이 다양하게 발전하고 있으며, 동영상 또는 이미지 등의 영상을 촬영하거나 촬영된 영상을 전송할 수도 있다. 그러나 휴대폰으로 촬영된 동영상 또는 이미지 역시 시간이 지난 후에는 디지털 카메라와 동일한 문제점을 갖는다.
이를 개선하여 영상에 텍스트와 같은 추가적인 정보를 입력하는 기술들이 개발되고 있는데, 이와 관련한 기술로는 대한민국 등록특허공보 등록번호 제10-1053045호 "영상물의 정보 입력 시스템", 등록번호 제10-1115701호 "음성 인식 기술을 이용하여 생성된 메타데이터로 영상 콘텐츠에 주석을 달기 위한 방법 및 장치" 등이 안출되어 있다.
이와 같은 종래기술들은 음성인식을 통해 음성을 인식하고, 인식된 음성을 문자텍스트 변환하여 디지털 사진에 부가하는 기술을 제안하고 있으나, 단순히 인식된 음성을 텍스트로 변환하여 사진에 부가하는 기술이어서 다양한 편집기능이 제공되는 않는 한계가 있었으며, 다수 인원이 음성을 발화하고 있는 상황에서 음성인식 오류가 발생되어 제기능을 수행하지 못하는 문제점이 있었다.
삭제
삭제
대한민국 등록특허공보 등록번호 제10-1053045호 "영상물의 정보 입력 시스템" 대한민국 등록특허공보 등록번호 제10-1115701호 "음성 인식 기술을 이용하여 생성된 메타데이터로 영상 콘텐츠에 주석을 달기 위한 방법 및 장치"
따라서 본 발명은 이와 같은 종래 기술의 문제점을 개선하여, 음성인식을 통해 자동으로 생성되는 음성기반 텍스트정보가 영상프레임 내부에 표기되도록 함으로써 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현될 수 있는 새로운 형태의 음성인식형 입체적 디지털영상 구현시스템을 제공하는 것을 목적으로 한다.
그리고 본 발명은 다양한 편집기능이 제공되어 사용자의 편의 향상과 다이나믹한 영상프레임 구현이 가능해지는 새로운 형태의 음성인식형 입체적 디지털영상 구현시스템을 제공하는 것을 목적으로 한다.
또한 본 발명은 인식된 음성정보를 실시간 확인하여 유효하지 않은 음성정보가 인식되거나 음성정보 인식오류가 발생될 경우 음성인식과 음성기반 텍스트정보의 생성이 재실행될 수 있도록 함으로써 잘못된 음성기반 텍스트정보가 영상프레임에 표기되는 것이 방지될 수 있는 새로운 형태의 음성인식형 입체적 디지털영상 구현시스템을 제공하는 것을 목적으로 한다.
이와 더불어 본 발명은 필요에 따라 촬영자의 음성과 피사체의 음성 중 어느 하나가 선택적으로 인식될 수 있도록 함으로써 음성인식의 기능성이 향상되는 새로운 형태의 음성인식형 입체적 디지털영상 구현시스템을 제공하는 것을 목적으로 한다.
덧붙여 본 발명은 음성기반 텍스트정보 이외에 미리 설정되어 있는 기본제공 텍스트정보나 사용자에 의해 입력되는 직접입력 텍스트정보도 영상프레임 내부에 표기될 수 있도록 함으로써 사용자의 선택 폭이 넓어지고 텍스트정보의 표기가 다변화될 수 있는 새로운 형태의 음성인식형 입체적 디지털영상 구현시스템을 제공하는 것을 목적으로 한다.
상술한 목적을 달성하기 위한 본 발명의 특징에 의하면, 본 발명은 외부의 음성을 인식하는 음성인식모듈(10a)과; 음성인식모듈(10a)로부터 인식된 음성정보를 텍스트정보로 변환하여 음성기반 텍스트정보를 생성시키는 정보변환모듈(20)과; 영상프레임 내부에 표기되는 텍스트정보에 대한 특성정보와 편집정보를 설정하는 텍스트정보 표기 설정모듈(30a)과; 피사체를 촬영하여 영상프레임을 생성시키는 촬영모듈(40)과; 사용자에 의해 음성인식모듈(10a)의 활성화 유무가 선택되도록 하는 음성인식모듈 활성화 관리모듈(10b)과; 음성인식모듈(10a)이 활성화될 경우, 텍스트정보 표기 설정모듈(30a)로부터 설정된 텍스트정보에 대한 특성정보와 편집정보에 맞추어 촬영모듈(40)로부터 생성된 영상프레임에 음성기반 텍스트정보가 표기되도록 하는 텍스트정보 표시 관리모듈(30b) 및; 텍스트정보가 표기된 영상프레임인 편집완료 영상프레임을 저장하고 관리하는 편집완료 영상프레임 관리모듈(30c)을 포함하는 것을 특징으로 하는 음성인식형 입체적 디지털영상 구현시스템을 제공한다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템에서 텍스트정보 표기 설정모듈(30a)은 텍스트정보의 글자크기가 설정되는 글자크기 설정유닛(31)과; 텍스트정보의 글자체가 설정되는 글자체 설정유닛(32)과; 텍스트정보의 글자색채가 설정되는 글자색채 설정유닛(33)과; 텍스트정보의 표기 언어 종류가 설정되는 표기 언어 설정유닛(34)과; 텍스트정보의 영상프레임 내 표기 위치가 설정되는 텍스트 표기위치 설정유닛(35)을 포함할 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 음성인식모듈(10a)과 정보변환모듈(20)로부터 생성된 음성기반 텍스트정보를 실시간 출력하는 디스플레이모듈(50)을 포함하여, 인식된 음성정보의 실시간 확인이 가능하도록 할 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 디스플레이모듈(50)에 출력된 음성기반 텍스트정보에 대한 사용자의 유효성 유무 판단에 의해 유효하지 않은 것으로 판단된 음성기반 텍스트정보가 삭제되도록 하는 음성기반 텍스트정보 삭제모듈(60)을 포함하여, 인식된 음성정보의 유효성 유무의 판단을 통해 유효하지 않은 음성정보 인식시 음성인식과 음성기반 텍스트정보의 생성이 재실행되도록 할 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 기본제공 텍스트정보가 설정되어 저장된 기본제공 텍스트정보 설정모듈(70)과; 사용자에 의해 기본제공 텍스트정보의 사용 유무가 선택되도록 하는 한편, 기본제공 텍스트정보 사용 선택시 디스플레이모듈(50)로 현재 설정되어 있는 복수의 기본제공 텍스트정보를 출력하여 사용자에 의해 선택되도록 하는 기본제공 텍스트정보 관리모듈(71)을 포함하고, 사용자에 의해 기본제공 텍스트정보 사용 선택시 음성인식모듈(10a)이 비활성화되도록 할 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 사용자에 의해 텍스트가 직접 입력되어 저장되는 직접입력 텍스트정보 입력모듈(80)과; 직접입력 텍스트정보의 사용 유무가 사용자에 의해 선택되도록 하는 한편, 직접입력 텍스트정보 사용 선택시 영상프레임 내부에 직접입력 텍스트정보가 표기되도록 하는 직접입력 텍스트정보 관리모듈(81)을 포함하고, 사용자에 의해 직접입력 텍스트정보 사용 선택시 음성인식모듈(10a)이 비활성화되도록 할 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 촬영모듈(40)의 위치지점으로부터 설정영역 내부에 위치한 촬영자의 음성을 인식하는 촬영자 음성인식모드와, 촬영모듈(40)의 위치지점으로부터 설정영역 외부에 위치한 피사체의 음성을 인식하는 피사체 음성인식모드 중에서 선택된 어느 하나의 음성인식모드가 사용자에 의해 선택되도록 하는 음성인식모드 선택모듈(90)을 포함하고, 음성인식모듈(10a)은 선택된 음성인식모드에 따라 촬영자 음성인식과 피사체 음성인식 중에서 선택된 어느 하나를 실행하게 될 수 있다.
이와 같은 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템은 휴대폰(2), 스마트 폰(3)을 포함하는 스마트 기기(5), 디지털 카메라(6)를 포함하는 디지털 기기(1)에 음성인식모듈(10a), 음성인식모듈 활성화 관리모듈(10b), 정보변환모듈(20), 텍스트정보 표기 설정모듈(30a), 촬영모듈(40), 텍스트정보 표시 관리모듈(30b), 편집완료 영상프레임 관리모듈(30c)이 구비되도록 할 수 있다.
본 발명에 의한 음성인식형 입체적 디지털영상 구현시스템에 의하면, 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현되고, 다양한 편집기능이 제공으로 사용자의 편의가 향상되며 다이나믹한 영상프레임 구현이 가능해지는 효과가 있다. 또한 본 발명에 의한 음성인식형 입체적 디지털영상 구현시스템에 의하면, 인식된 음성정보의 실시간 확인을 통해 유효하지 않은 음성정보가 인식되거나 음성정보 인식오류가 발생될 경우 음성인식과 음성기반 텍스트정보의 생성이 재실행될 수 있으므로 잘못된 음성기반 텍스트정보가 영상프레임에 표기되는 것이 방지되는 효과가 있다.
그리고 본 발명에 의한 음성인식형 입체적 디지털영상 구현시스템에 의하면, 필요에 따라 촬영자의 음성이나 피사체의 음성이 선택적으로 인식되도록 하므로, 음성인식의 기능성이 향상되며, 음성기반 텍스트정보 이외에 미리 설정되어 있는 기본제공 텍스트정보나 사용자에 의해 입력되는 직접입력 텍스트정보도 영상프레임 내부에 표기될 수 있으므로, 사용자의 선택 폭이 넓어지고 텍스트정보의 표기가 다변화되는 효과가 있다.
도 1은 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템이 적용되는 디지털 기기의 예시도;
도 2는 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템의 기본 구성블록도;
도 3은 본 발명의 실시예에 따른 텍스트정보 표기 설정모듈의 구성블록도;
도 4는 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템의 음성정보 유효성 판단 구성을 보여주기 위한 블록도;
도 5는 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템의 확장 구성블록도;
도 6은 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템의 음성정보모드 선택 및 실행 구성을 보여주기 위한 블록도이다.
이하, 본 발명의 실시예를 첨부된 도면 도 1 내지 도 6에 의거하여 상세히 설명한다. 한편, 도면과 상세한 설명에서 일반적인 음성인식, 음성정보의 텍스트정보 변환기술, 영상 촬영기술, 텍스트의 영상프레임 표기 기술, 영상 편집기술 등으로부터 이 분야의 종사자들이 용이하게 알 수 있는 구성 및 작용에 대한 도시 및 언급은 간략히 하거나 생략하였다. 특히 도면의 도시 및 상세한 설명에 있어서 본 발명의 기술적 특징과 직접적으로 연관되지 않는 요소의 구체적인 기술적 구성 및 작용에 대한 상세한 설명 및 도시는 생략하고, 본 발명과 관련되는 기술적 구성만을 간략하게 도시하거나 설명하였다.
본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 도 1에서와 같이 휴대폰(2), 스마트 폰(3)이나 스마트 패드(4)와 같은 스마트 기기(5), 디지털 카메라(6)를 포함하는 디지털 기기(1)에 적용되는 것으로, 음성인식을 통해 자동으로 생성되는 음성기반 텍스트정보가 영상프레임 내부에 표기되도록 함으로써 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현될 수 있도록 한다.
이를 위한 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 도 2에서와 같이 음성인식모듈(10a), 정보변환모듈(20), 텍스트정보 표기 설정모듈(30a), 촬영모듈(40), 음성인식모듈 활성화 관리모듈(10b), 텍스트정보 표시 관리모듈(30b), 편집완료 영상프레임 관리모듈(30c)을 포함하는 구성으로 이루어진다.
여기서 음성인식모듈(10a), 음성인식모듈 활성화 관리모듈(10b), 정보변환모듈(20), 텍스트정보 표기 설정모듈(30a), 촬영모듈(40), 텍스트정보 표시 관리모듈(30b), 편집완료 영상프레임 관리모듈(30c)이 전술(前述)된 각종 디지털 기기(1)에 구비되면서 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템(100)이 구현되게 된다.
음성인식모듈(10a)은 외부의 음성을 인식하는 것으로, 촬영자나 피사체 인물이 외치는 각종 구호, 소리, 음성들을 인식하게 된다. 즉 영상촬영시 발화될 수 있는“자기야 사랑해”“다같이 화이팅”“여기 프랑스야”“부모님 건강하세요”“몇년도 몇 번째 생일날”“11번째 결혼기념일 아내와 함께”“막내 돌잔칫날”“김치”"치즈““스마일”“친구야 힘내”“해운대에서”“고등학교 동기모임”“자 찍습니다”“I love you" 등의 각종 음성들이 음성인식모듈(10a)을 통해 인식될 수 있다.
정보변환모듈(20)은 음성인식모듈(10a)로부터 인식된 음성정보를 텍스트정보로 변환하여 음성기반 텍스트정보를 생성시키는 모듈이다.
텍스트정보 표기 설정모듈(30a)은 영상프레임 내부에 표기되는 텍스트정보에 대한 특성정보와 편집정보를 설정하는 모듈이다. 이를 위하여 텍스트정보 표기 설정모듈(30a)은 도 3에서와 같이 텍스트정보의 글자크기(4, 6, 8, 10, 12, 15, 30 등의 글자크기)가 설정되는 글자크기 설정유닛(31), 텍스트정보의 글자체(명조체, 고딕체, 궁서체, 굴림체, 돋움체, 바탕체, 기타 적용가능한 모든 글자체)가 설정되는 글자체 설정유닛(32), 텍스트정보의 글자색체(사용자가 원하는 각종 색채)가 설정되는 글자색채 설정유닛(33), 텍스트정보의 표기 언어 종류(한글, 영어, 중국어, 일어, 프랑스어, 독일어 등 모든 언어)가 설정되는 표기 언어 설정유닛(34), 텍스트정보의 영상프레임 내 표기 위치(우상면, 우하면, 좌상면, 좌하면, 정중앙 등 사진상의 모든 위치)가 설정되는 텍스트 표기위치 설정유닛(35)을 포함할 수 있다.
촬영모듈(40)은 피사체를 촬영하여 영상프레임을 생성시키는 모듈이다. 여기서 촬영모듈(40)은 정지영상인 사진을 촬영하여 영상프레임으로 생성시킬 수도 있고, 동영상을 촬영하여 영상프레임으로 생성시킬 수도 있다.
음성인식모듈 활성화 관리모듈(10b)은 사용자에 의해 음성인식모듈(10a)의 활성화 유무가 선택되도록 하는 모듈이다. 음성인식모듈 활성화 관리모듈(10b)에 의해 음성인식모듈(10a)이 활성화되면, 음성인식모듈(10a)은 음성인식을 시작하게 된다.
텍스트정보 표시 관리모듈(30b)은 음성인식모듈(10a)이 활성화될 경우, 텍스트정보 표기 설정모듈(30a)로부터 설정된 텍스트정보에 대한 특성정보와 편집정보에 맞추어 촬영모듈(40)로부터 생성된 영상프레임에 음성기반 텍스트정보가 표기되도록 하는 모듈이다. 한편 본 발명에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 사진촬영시간 표기 여부가 사용자에 의해 선택될 수 있도록 하는데, 사진 촬영시간 표기가 선택될 경우 텍스트정보 표시 관리모듈(30b)은 텍스트정보와 함께 사진 촬영시간이 표기되도록 한다.
편집완료 영상프레임 관리모듈(30c)은 텍스트정보가 표기된 영상프레임인 편집완료 영상프레임을 저장하고 관리하는 모듈이다.
여기서 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 도 4에서와 같이 디스플레이모듈(50)와 음성기반 텍스트정보 삭제모듈(60)를 구비하여 인식된 음성정보의 유효성 유무의 판단을 통해 유효하지 않은 음성정보 인식시 음성인식과 음성기반 텍스트정보의 생성이 재실행되도록 할 수 있다.
디스플레이모듈(50)은 음성인식모듈(10a)과 정보변환모듈(20)로부터 생성된 음성기반 텍스트정보를 실시간 출력하는 모듈로서, 인식된 음성정보의 실시간 확인이 가능하도록 한다.
음성기반 텍스트정보 삭제모듈(60)은 디스플레이모듈(50)에 출력된 음성기반 텍스트정보에 대한 사용자의 유효성 유무 판단에 의해 유효하지 않은 것으로 판단된 음성기반 텍스트정보가 삭제되도록 하는 모듈이다.
또한 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 도 5에서와 같이 기본제공 텍스트정보 관리모듈(71), 기본제공 텍스트정보 관리모듈(71), 직접입력 텍스트정보 입력모듈(80), 직접입력 텍스트정보 관리모듈(81)을 구비하여 음성기반 텍스트정보 이외에 기본제공 텍스트정보나 직접입력 텍스트정보도 영상프레임에 표기될 수 있도록 할 수 있다.
기본제공 텍스트정보 설정모듈(70)은 기본제공 텍스트정보가 설정되어 저장되는 모듈이다. 기본제공 텍스트정보로는 영상 촬영시 자주 사용하는 문장들인 “김치”“치즈””화이팅“”사랑해“ 등이 설정될 수 있고, 이외의 다양한 문장들이 시스템 설계자나 사용자에 의해 설정될 수 있다.
기본제공 텍스트정보 관리모듈(71)은 사용자에 의해 기본제공 텍스트정보의 사용 유무가 선택되도록 하는 한편, 기본제공 텍스트정보 사용 선택시 디스플레이모듈(50)로 현재 설정되어 있는 복수의 기본제공 텍스트정보를 출력하여 사용자에 의해 선택되도록 하는 모듈이다. 사용자에 의해 기본제공 텍스트정보 사용 선택시 음성인식모듈(10a)이나 직접입력 텍스트정보 입력모듈(80)은 비활성화된다.
직접입력 텍스트정보 입력모듈(80)은 사용자에 의해 텍스트가 직접 입력되어 저장되는 모듈이다.
직접입력 텍스트정보 관리모듈(81)은 직접입력 텍스트정보의 사용 유무가 사용자에 의해 선택되도록 하는 한편, 직접입력 텍스트정보 사용 선택시 영상프레임 내부에 직접입력 텍스트정보가 표기되도록 하는 모듈이다.
사용자에 의해 직접입력 텍스트정보 사용 선택시 음성인식모듈(10a)이나 기본제공 텍스트정보 관리모듈(71)이 비활성화된다.
한편 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 도 6에서와 같이 음성인식모드 선택모듈(90)을 구비하여 선택된 음성인식모드에 따라 음성인식이 수행되도록 할 수 있다.
음성인식모드 선택모듈(90)은 촬영모듈(40)의 위치지점으로부터 설정영역 내부에 위치한 촬영자의 음성을 인식하는 촬영자 음성인식모드와, 촬영모듈(40)의 위치지점으로부터 설정영역 외부에 위치한 피사체의 음성을 인식하는 피사체 음성인식모드 중에서 선택된 어느 하나의 음성인식모드가 사용자에 의해 선택되도록 하는 모듈이다. 이에 대응하여 음성인식모듈(10a)은 선택된 음성인식모드에 따라 촬영자 음성인식과 피사체 음성인식 중에서 선택된 어느 하나를 실행하게 된다.
상기와 같이 구성된 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템(100)은 음성인식을 통해 자동으로 생성되는 음성기반 텍스트정보가 영상프레임 내부에 표기되도록 함으로써 사진, 동영상과 같은 영상프레임이 생동감있고 입체적으로 구현될 수 있으며, 다양한 편집기능이 제공되어 사용자의 편의 향상과 다이나믹한 영상프레임 구현이 가능해지는 한편, 인식된 음성정보를 실시간 확인하여 유효하지 않은 음성정보가 인식되거나 음성정보 인식오류가 발생될 경우 음성인식과 음성기반 텍스트정보의 생성이 재실행될 수 있도록 하고, 필요에 따라 촬영자의 음성과 피사체의 음성 중 어느 하나가 선택적으로 인식될 수 있도록 함으로써 음성인식의 기능성이 향상되며, 음성기반 텍스트정보 이외에 미리 설정되어 있는 기본제공 텍스트정보나 사용자에 의해 입력되는 직접입력 텍스트정보도 영상프레임 내부에 표기될 수 있도록 함으로써 사용자의 선택 폭이 넓어지고 텍스트정보의 표기가 다변화될 수 있다.
상술한 바와 같은, 본 발명의 실시예에 따른 음성인식형 입체적 디지털영상 구현시스템을 상기한 설명 및 도면에 따라 도시하였지만, 이는 예를 들어 설명한 것에 불과하며 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 변화 및 변경이 가능하다는 것을 이 분야의 통상적인 기술자들은 잘 이해할 수 있을 것이다.
1 : 디지털 기기 2 : 휴대폰
3 : 스마트 폰 4 : 스마트 패드
5 : 스마트 기기 6 : 디지털 카메라
10a : 음성인식모듈 10b : 음성인식모듈 활성화 관리모듈
20 : 정보변환모듈 30a : 텍스트정보 표기 설정모듈
31 : 글자크기 설정유닛 32 : 글자체 설정유닛
33 : 글자색채 설정유닛 34 : 표기 언어 설정유닛
35 : 텍스트 표기위치 설정유닛 30b : 텍스트정보 표시 관리모듈
30c : 편집완료 영상프레임 관리모듈 40 : 촬영모듈
50 : 디스플레이모듈 60 : 음성기반 텍스트정보 삭제모듈
70 : 기본제공 텍스트정보 설정모듈 71 : 기본제공 텍스트정보 관리모듈
80 : 직접입력 텍스트정보 입력모듈 81 : 직접입력 텍스트정보 관리모듈
90 : 음성인식모드 선택모듈
100 : 음성인식형 입체적 디지털영상 구현시스템

Claims (8)

  1. 촬영자와 피사체 인물 중에서 선택된 어느 하나가 외치는 구호, 소리, 음성을 인식하게 되는 음성인식모듈(10a)과;
    음성인식모듈(10a)로부터 인식된 음성정보를 텍스트정보로 변환하여 음성기반 텍스트정보를 생성시키는 정보변환모듈(20)과;
    영상프레임 내부에 표기되는 텍스트정보에 대한 특성정보와 편집정보를 설정하되, 텍스트정보의 글자크기가 설정되는 글자크기 설정유닛(31), 텍스트정보의 글자체가 설정되는 글자체 설정유닛(32), 텍스트정보의 글자색체가 설정되는 글자색채 설정유닛(33), 텍스트정보의 표기 언어 종류가 설정되는 표기 언어 설정유닛(34), 텍스트정보의 영상프레임 내 표기 위치가 설정되는 텍스트 표기위치 설정유닛(35)을 포함하는 구성으로 이루어지는 텍스트정보 표기 설정모듈(30a)과;
    피사체를 촬영하여 영상프레임을 생성시키되, 정지영상인 사진과 동영상 중에서 선택된 어느 하나를 촬영하여 영상프레임으로 생성시키는 촬영모듈(40)과;
    사용자에 의해 음성인식모듈(10a)의 활성화 유무가 선택되도록 하는 음성인식모듈 활성화 관리모듈(10b)과;
    음성인식모듈(10a)이 활성화될 경우, 텍스트정보 표기 설정모듈(30a)로부터 설정된 텍스트정보에 대한 특성정보와 편집정보에 맞추어 촬영모듈(40)로부터 생성된 영상프레임에 음성기반 텍스트정보가 표기되도록 하고, 사진촬영시간 표기가 사용자에 의해 선택될 경우, 텍스트정보와 함께 사진 촬영시간이 표기되도록 하는 텍스트정보 표시 관리모듈(30b)과;
    텍스트정보가 표기된 영상프레임인 편집완료 영상프레임을 저장하고 관리하는 편집완료 영상프레임 관리모듈(30c)과;
    음성인식모듈(10a)과 정보변환모듈(20)로부터 생성된 음성기반 텍스트정보를 실시간 출력하여 인식된 음성정보의 실시간 확인이 가능하도록 하는 디스플레이모듈(50)과;
    디스플레이모듈(50)에 출력된 음성기반 텍스트정보에 대한 사용자의 유효성 유무 판단에 의해 유효하지 않은 것으로 판단된 음성기반 텍스트정보가 삭제되도록 하는 음성기반 텍스트정보 삭제모듈(60)과;
    시스템 설계자와 사용자에 의해 설정되는 기본제공 텍스트정보가 설정되어 저장되는 기본제공 텍스트정보 설정모듈(70)과;
    사용자에 의해 기본제공 텍스트정보의 사용 유무가 선택되도록 하는 한편, 기본제공 텍스트정보 사용 선택시 디스플레이모듈(50)로 현재 설정되어 있는 복수의 기본제공 텍스트정보를 출력하여 사용자에 의해 선택되도록 하며, 사용자에 의해 기본제공 텍스트정보 사용 선택시 음성인식모듈(10a)이나 직접입력 텍스트정보 입력모듈(80)이 비활성화되도록 하는 기본제공 텍스트정보 관리모듈(71)과;
    사용자에 의해 텍스트가 직접 입력되어 저장되는 직접입력 텍스트정보 입력모듈(80)과;
    직접입력 텍스트정보의 사용 유무가 사용자에 의해 선택되도록 하는 한편, 직접입력 텍스트정보 사용 선택시 영상프레임 내부에 직접입력 텍스트정보가 표기되도록 하며, 사용자에 의해 직접입력 텍스트정보 사용 선택시 음성인식모듈(10a)이나 기본제공 텍스트정보 관리모듈(71)이 비활성화되도록 하는 직접입력 텍스트정보 관리모듈(81)과;
    촬영모듈(40)의 위치지점으로부터 설정영역 내부에 위치한 촬영자의 음성을 인식하는 촬영자 음성인식모드와, 촬영모듈(40)의 위치지점으로부터 설정영역 외부에 위치한 피사체의 음성을 인식하는 피사체 음성인식모드 중에서 선택된 어느 하나의 음성인식모드가 사용자에 의해 선택되도록 하여 음성인식모듈(10a)이 선택된 음성인식모드에 따라 촬영자 음성인식과 피사체 음성인식 중에서 선택된 어느 하나를 실행하도록 하는 음성인식모드 선택모듈(90)을 포함하는 구성으로 이루어지고,
    휴대폰(2), 스마트 폰(3)과 스마트 패드(4)를 포함하는 스마트 기기(5), 디지털 카메라(6)를 포함하는 디지털 기기(1)에 적용되는 것을 특징으로 하는 음성인식형 입체적 디지털영상 구현시스템.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
KR1020150066329A 2015-05-12 2015-05-12 음성인식형 입체적 디지털영상 구현시스템 KR101742779B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150066329A KR101742779B1 (ko) 2015-05-12 2015-05-12 음성인식형 입체적 디지털영상 구현시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150066329A KR101742779B1 (ko) 2015-05-12 2015-05-12 음성인식형 입체적 디지털영상 구현시스템

Publications (2)

Publication Number Publication Date
KR20160133335A KR20160133335A (ko) 2016-11-22
KR101742779B1 true KR101742779B1 (ko) 2017-06-01

Family

ID=57540175

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150066329A KR101742779B1 (ko) 2015-05-12 2015-05-12 음성인식형 입체적 디지털영상 구현시스템

Country Status (1)

Country Link
KR (1) KR101742779B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101943898B1 (ko) * 2017-08-01 2019-01-30 주식회사 카카오 스티커를 이용한 서비스 제공 방법 및 사용자 단말
KR20220022315A (ko) * 2020-08-18 2022-02-25 삼성전자주식회사 카메라 및 마이크를 포함하는 전자 장치
KR102213618B1 (ko) * 2020-09-03 2021-02-09 주식회사 웨인힐스벤처스 인공지능을 이용하여 사용자의 음성 데이터에 적합한 멀티미디어를 자동으로 생성하는 멀티미디어 자동 생성 시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063063A (ja) * 2003-08-08 2005-03-10 Sharp Corp 携帯型情報処理装置および画像合成方法
JP2009141555A (ja) * 2007-12-05 2009-06-25 Fujifilm Corp 音声入力機能付き撮像装置及びその音声記録方法
JP2014053876A (ja) * 2012-09-10 2014-03-20 Canon Marketing Japan Inc 撮影装置、撮影装置の制御方法、及びコンピュータプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8316302B2 (en) 2007-05-11 2012-11-20 General Instrument Corporation Method and apparatus for annotating video content with metadata generated using speech recognition technology
KR101053045B1 (ko) 2011-01-07 2011-08-01 이정렬 영상물의 정보 입력 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063063A (ja) * 2003-08-08 2005-03-10 Sharp Corp 携帯型情報処理装置および画像合成方法
JP2009141555A (ja) * 2007-12-05 2009-06-25 Fujifilm Corp 音声入力機能付き撮像装置及びその音声記録方法
JP2014053876A (ja) * 2012-09-10 2014-03-20 Canon Marketing Japan Inc 撮影装置、撮影装置の制御方法、及びコンピュータプログラム

Also Published As

Publication number Publication date
KR20160133335A (ko) 2016-11-22

Similar Documents

Publication Publication Date Title
US8599251B2 (en) Camera
US20170287192A1 (en) User terminal device for displaying an object image in which a feature part changes based on image metadata and the control method thereof
JP2017118472A (ja) 画像処理装置、画像処理方法及びプログラム
KR102159767B1 (ko) 시선 추적을 이용한 시인성 개선 방법, 저장 매체 및 전자 장치
JP2011097565A (ja) グラフィック配置決定方法ならびにそのプログラムおよび情報処理装置
KR101742779B1 (ko) 음성인식형 입체적 디지털영상 구현시스템
CN106791390A (zh) 广角自拍实时预览方法及用户终端
CN110149479A (zh) 双摄像头成像方法、装置、终端和介质
US20160350622A1 (en) Augmented reality and object recognition device
KR102138835B1 (ko) 정보 노출 방지 영상 제공 장치 및 방법
JP2017188787A (ja) 撮像装置、画像合成方法、および画像合成プログラム
JP6399371B1 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP5910639B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
KR20140134844A (ko) 객체 기반 사진 촬영 방법 및 장치
CN112990208B (zh) 一种文本识别方法及装置
KR20170043202A (ko) 영상 촬영 장치 및 이의 제어 방법
JP6183721B2 (ja) 写真撮影遊戯機、及び制御プログラム
KR20200114170A (ko) 배경 제거 사진 촬영과 이를 이용한 합성사진 촬영 방법 및 컴퓨터 프로그램
JP2006172146A (ja) データ管理機能を有する機器、及び、データ管理プログラム
WO2006109459A1 (ja) 人物撮影装置、及び人物撮影方法
JP2013218349A (ja) 遊戯用撮影装置、遊戯用撮影方法及びコンピュータプログラム
KR102623605B1 (ko) 반려 동물의 생체 정보를 취득하는 전자 장치 및 그 동작 방법
WO2023189734A1 (ja) 物体識別装置、物体識別方法及びプログラム
JP2010224706A (ja) 似顔絵作成システム、制御サーバ、クライアント端末、似顔絵作成方法、およびプログラム
JP2014127723A (ja) カメラ機能付き電子機器

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant