KR20040051528A - 디지털 카메라 - Google Patents

디지털 카메라 Download PDF

Info

Publication number
KR20040051528A
KR20040051528A KR1020030089478A KR20030089478A KR20040051528A KR 20040051528 A KR20040051528 A KR 20040051528A KR 1020030089478 A KR1020030089478 A KR 1020030089478A KR 20030089478 A KR20030089478 A KR 20030089478A KR 20040051528 A KR20040051528 A KR 20040051528A
Authority
KR
South Korea
Prior art keywords
digital camera
image
voice
code
folder
Prior art date
Application number
KR1020030089478A
Other languages
English (en)
Other versions
KR100770637B1 (ko
Inventor
이노우에마사시
Original Assignee
후지 샤신 필름 가부시기가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지 샤신 필름 가부시기가이샤 filed Critical 후지 샤신 필름 가부시기가이샤
Publication of KR20040051528A publication Critical patent/KR20040051528A/ko
Application granted granted Critical
Publication of KR100770637B1 publication Critical patent/KR100770637B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Studio Devices (AREA)

Abstract

(과제) 촬영후의 화상관리를 용이하게 행할 수 있도록 했다.
(해결수단) 촬영조작에 따라 촬영렌즈(101)를 경유해서 입사한 피사체광을 고체촬상소자(110)로 포착하여 화상데이터를 생성하고, 그 화상데이터를 기록부(130)에 기록하는 디지털 카메라에 있어서, 촬영자의 음성을 집음(集音)하는 마이크로폰(150)과, 그 마이크로폰(150)으로부터 출력되는 음성을 인식해서 문자코드를 출력하는 음성인식부(142)와, 음성인식부(142)로부터의 문자열코드에 기초하여 상기 기록부(130)에 상기 문자열코드에 대응하는 폴더의 명칭코드가 존재하는지의 여부를 판정하고, 그 문자열코드와 명칭코드가 일치할 때 상기 폴더에 화상데이터를 기록하는 처리를 행하는 화상신호처리부(112)를 구비했다.

Description

디지털 카메라{DIGITAL CAMERA}
본 발명은 촬영조작에 따라 생성한 화상데이터를 기록부에 기록하는 디지털 카메라에 관한 것이다.
종래의 원고스캐너 또는 디지털 카메라 등의 휴대입력장치에 있어서, 음성명령의 수신에 의해 조작을 실행하는 기술이 있다(예를 들면, 특허문헌1 참조).
또, 종래의 전자카메라에 있어서, 기록부에 존재하는 복수의 폴더를 용도별로 분별하여 사용하도록 한 기술도 있다(예를 들면, 특허문헌2 참조).
(특허문헌1)
일본 특허공개 2000-215021호 공보(단락번호 0021, 도1)
(특허문헌2)
일본 특허공개 2001-169222호 공보(요약, 도1)
디지털 카메라의 조작은 셔터조작에 의한 화상입력 외에 기록매체 등의 기록부에의 화상기록이 필요하게 된다. 특허문헌2에 나타내듯이, 종래에는 이 조작은 모두 키조작에 의해 행하고 있고, 화상기록을 할 때마다 그 조작을 행하므로 조작이 번잡하고 시간이 걸린다라는 문제가 있다.
본 발명은 상기 사정을 감안하여, 촬영후의 화상관리를 용이하게 행할 수 있도록 한 디지털 카메라를 제공하는 것을 목적으로 한다.
도1은 본 발명의 일실시형태인 디지털 카메라의 외관도이다.
도2는 도1의 디지털 카메라내에 구비되는 신호처리부의 구성블록도이다.
도3은 일실시형태의 디지털 카메라의 동작을 나타내는 플로챠트이다.
도4는 기록미디어의 폴더계층구조의 일례를 나타낸 도이다.
(부호의 설명)
100:디지털 카메라 101:촬영렌즈
110:CCD고체촬상소자 111:CPU(신호처리부)
112:DSP(화상신호처리부) 130:기록미디어(기록부)
142:음성인식부 150:마이크로폰
F1,F2,F3:폴더
상기 목적을 달성하는 본 발명의 디지털 카메라는, 촬영조작에 따라 촬영렌즈를 경유하여 입사한 피사체광을 고체촬상소자로 포착하여 화상데이터를 생성하고, 그 화상데이터를 기록부에 기록하는 디지털 카메라에 있어서, 촬영자의 음성을 집음하는 마이크로폰과, 상기 마이크로폰으로부터 출력되는 음성신호를 인식해서 문자열코드를 출력하는 음성인식부와, 상기 음성인식부로부터의 문자열코드에 기초하여 상기 기록부에 상기 문자열코드에 대응하는 폴더의 명칭코드가 존재하는지의 여부를 판정하고, 상기 문자열코드와 명칭코드가 일치할 때 그 폴더에 화상데이터를 기록하는 처리를 행하는 화상신호처리부를 구비한 것을 특징으로 한다.
본 발명의 디지털 카메라에서는, 촬영자가 음성에 의해 화상의 내용을 나타내는 음성을 마이크로폰에 입력하고, 상기 마이크로폰으로부터의 음성신호를 음성인식부에서 문자열코드로 변환하고, 음성인식부로부터의 문자열코드에 기초하여 기록부에 상기 문자열코드에 대응하는 폴더의 명칭코드가 존재하는지의 여부를 판정하고, 문자열코드와 명칭코드가 일치할 때 상기 폴더에 화상데이터를 기록하는 처리를 행한다. 이것에 의해, 촬영후의 화상관리는 음성만으로 행하는 것이 가능하게 되며, 화상관리가 용이하게 된다.
상기 화상신호처리부는 상기 기록부에 상기 문자열코드에 대응하는 명칭코드의 폴더가 존재하지 않는다라고 판정한 경우에는 새롭게 상기 문자열코드에 기초한 명칭코드를 갖는 폴더를 작성한 후 그 폴더에 화상데이터를 기록하는 처리를 행하는 것이 바람직하다. 이것에 의해, 음성데이터용 폴더가 존재하지 않는 경우라도 촬영후의 화상관리를 음성으로 행하는 것이 가능하게 된다.
상기 마이크로폰에 입력하는 음성은 화상의 내용을 나타내는 키워드인 것이 바람직하다.
이하, 본 발명의 실시형태에 대해서 설명한다.
도1은 본 발명의 실시형태를 나타내는 제1디지털 카메라의 외관도로서, (a)는 정면도, (b)는 배면도이다.
도1에 나타내는 디지털 카메라(100)는 촬영렌즈(101)로부터 카메라(100)내부에 구비되어 있는 CCD고체촬상소자(110)까지 피사체의 상이 안내되도록 되어 있다. 디지털 카메라(100)의 배면에는 사용자가 이 디지털 카메라(100)를 사용할 때 여러가지 조작을 행하기 위한 조작부가 설치되어 있다.
이 조작부에는 조작용 스위치군과 LCD화면(105a)이 설치되어 있다. 조작스위치군에는 디지털 카메라를 작동시키기 위한 전원투입용 파워스위치(102), 촬영과 재생을 자유롭게 전환할 수 있는 촬영/재생 전환레버(103), 실행키(106a), 취소키(106b), 십자키(107) 및 플래시발광부(104)의 팝업스위치(108) 등이 있다. 이 십자키(107)의 내측에는 표시부(107a)가 설치되어 있어 LCD화면(105a)에 표시되는 선태메뉴의 항목을 십자키(107)에 의해 선택할 수 있도록 되어 있다. 또한 LCD화면(105a)의 표시, 비표시의 전환을 행하기 위한 표시키(1051)도 설치되어 있다. 또, 이 디지털 카메라(100)의 상방에는 릴리즈버튼(109)이 구비되어 있다. 이 릴리즈버튼(109)이 완전히 눌려지면 촬영의 개시지시가 디지털 카메라 내부의 후술하는 신호처리부에 전달된다.
또, 이 디지털 카메라(100)는 촬영/재생 전환레버(103)에 의해 촬영과 재생의 전환이 가능하게 되어 있으며, 촬영을 행할 때에는 사용자에 의해 촬영/재생 전환레버(103)가 촬영측(103a)으로 전환되고, 재생을 행할 때에는 촬영/재생 전환레버(103)가 재생측(103b)으로 전환된다. 또, 야간촬영도 행할 수 있도록 플래시발광장치(104)가 구비되어 있다.
또한, 이 디지털 카메라(100)는 적절한 위치에 마이크로폰(150)이 내장되어있어, 촬영자의 음성을 입력할 수 있도록 되어 있다.
도2는 디지털 카메라(100)의 내부에 설치되어 있는 신호처리회로의 일례를 나타내는 블록구성도이다.
본 실시형태의 디지털 카메라(100)에서는 모든 처리가 CPU(111)에 의해 제어되고 있으며, 이 CPU(111)의 제어하에 DSP(112)에 의해 CCD고체촬상소자(110)에 의해 얻어진 화상데이터의 처리가 행해진다. 이 CPU(111)와 DSP(112)는 도시하지 않은 버스로 접속되어 있고, 이 버스를 통해 데이터의 교환이 행해진다. 또, CPU(111)에는 SDRAM(113)과 FLASHROM(114)이 접속되어 있고, SDRAM(113)에는 DSP(112)에서 처리가 행해지는 화상데이터가 기억되고, FLASHROM(114)에는 CPU(111)에 처리를 실행시키기 위한 프로그램이 기억되어 있다. 도2에는 DSP(112)측으로 SDRAM(113)에 기억된 화상데이터의 판독이 행해지는 것이 화살표로 나타내어져 있다.
이 CPU(111)의 입력부에는, 도1에 나타낸 각종 키 및 스위치로 이루어지는 조작부(115)의 조작에 따른 전기신호가 입력된다. 이 조작부(115)에는 도1에 나타낸 파워스위치(102), 촬영/재생 전환레버(103), 표시키(1051), 실행키(106a), 취소키(106b), 상측키(1071), 우측키(1072), 하측키(1073), 좌측키(1074)의 4개의 키로 구성되는 십자키(107), 릴리즈버튼(109)에 동기해서 작동하는 셔터스위치 등이 있다. 이 셔터스위치에는 릴리즈버튼(109)의 반누름상태와 완전누름상태가 구별되도록 2개의 접점이 구비되어 있고, 릴리즈버튼(109)의 반누름상태는 촬영의 스탠바이상태를 나타내는 것으로서 CPU(111)에 인식된다.
마이크로폰(150)으로부터의 음성신호는 오디오 인터페이스(140)를 통해 DSP(112)에서 수취되고, 이 수취된 신호가 일단, DSP(112)내에 기억되고, 필요에 따라 그 기억된 음성신호가 오디오 인터페이스(140)를 통해 스피커(141)에 공급되도록 되어 있다. DSP(112)내의 음성신호처리부는 본 실시형태의 디지털 카메라로 빔촬영이 행해지는 경우 등에 이용된다.
또, 이 실시형태의 디지털 카메라(100)에서는 오디오 인터페이스(140)의 출력은 음성인식부(142)를 통해 DSP(112)에 입력되도록 되어 있다.
또한, 본 실시형태의 디지털 카메라(100)에서는 LCD화면(105a)에 표시메뉴의 표시가 가능한 구성으로 되어 있고, 그 메뉴로 나타내어지는 항목의 선택이 상기 십자키(107)에 의해 행해진다.
이 십자키(107)에서는 LCD화면(105a)에 표시되는 선택메뉴의 복수의 항목 중 어느 하나를 선택할 수 있도록 되어 있다. 도1에 나타낸 십자키의 4개의 키 중, 상측키(1071)가 눌려지면 상방향으로 LCD화면(105a)에 표시된 커서가 이동하고, 우측키(1072)가 눌려지면 커서가 오른쪽방향으로 이동하는 구성으로 되어 있다.
이들 키(1071∼1074)가 눌려졌을 때, 이들 키(1071∼1074)가 눌려진 것이 CPU(111)에 인식되고, CPU(111)에서는 4개의 키(1071∼1074) 중, 어느 하나의 키가 눌려진 것에 기초하여 버스를 경유해서 LCD화면(105a)에 커서의 이동지시가 전송된다. 그렇게 하면 복수 표시되어 있는 항목 중 어느 하나로 커서가 이동해서 이들 항목 중 어느 하나가 그 이동한 커서에 의해 선택된다.
커서가 항목 중 어느 하나에 놓여진 상태로 실행키(106a)가 눌려지면 그 항목이 실행된다. 따라서 사용자는 LCD화면(105a)에 표시된 커서에 의해 선택메뉴 중의, 복수의 항목 중 어느 하나를 선택할 수 있다.
촬영/재생 전환레버(103)가 재생측(103b)으로 전환되면 기록미디어로부터의 재생이 행해진다. 이 때에는 촬영을 행하기 위한 지시를 행하는 릴리즈버튼 등으로부터의 신호가 입력되어도 처리는 행해지지 않는다.
다음에 CPU(111)의 출력부를 설명한다.
CPU(111)의 출력부에는 타이밍 제너레이터(이하 TG라고 함)(116), 포커스렌즈(118)를 구동하기 위한 모터드라이버(이하 DRV라고 함)(117) 및 플래시발광부(104)에 플래시발광을 행하게 하는 플래시발광장치(104a)가 접속되어 있다.
촬영을 행할 때에는 LCD화면(105a)상에 피사체상이 피사체의 움직임에 맞춰 표시되어 있다. 이 표시되어 있는 피사체의 상을 보면서, 사용자에 의해 프레이밍이 행해지고, 릴리즈버튼(109)이 완전히 눌려지면 촬영이 행해진다. 이 릴리즈버튼(109)이 완전히 눌려지면, CPU(111)에서는 촬영개시를 지시하는 신호가 TG(116)로 출력된다. TG(116)에서는 이 지시를 받아 CCD고체촬상소자(110)에 릴리즈버튼(109)이 눌려진 것을 알리는 신호가 공급된다. 이 신호를 받아서 CCD고체촬상소자(110)에서는 릴리즈버튼(109)이 완전히 눌려졌을 때 CCD고체촬상소자(110)에 의해 촬상되어 있던 화상데이터가 RGB신호로서 출력된다.
이하에, CCD고체촬상소자(110)에 의해 촬상된 촬상신호가 어떻게 처리되는지를 순서에 따라 설명한다.
CCD고체촬상소자(110)에 의해 얻어진 촬상신호는 RGB신호로 되어 CDS 및 A/D부(119)로 공급된다. 이 CDS 및 A/D부(119)에서 잡음의 저감이 행해진 후 디지털신호로 변환되고, 디지털의 RGB신호로 되어 DSP(112)로 공급된다. 이 DSP(112)내에는 화상신호처리부, 압축처리부, AE(Auto Exposure)검출부, AWB(Auto White Balance)검출부, 비디오 인코더, 음성신호처리부 등의 각 신호처리부가 포함되어 있다.
따라서, 이 DSP(112)에서 CCD고체촬상소자(110)에 의해 얻어진 RGB신호로 이루어지는 화상데이터에 일련의 처리가 실시되고, 그 처리가 실시된 화상데이터가 LCD(105), 기록미디어(130)라는 출력기기로 출력된다. 음성에 대해서는 마이크로폰(150), 스피커(141) 등의 음성입출력기기에 필요한 음성신호의 처리가 DSP(112)에서 행해진다. 이 실시형태의 디지털 카메라(100)에서는 마이크로폰(150)으로부터의 음성신호가 오디오 인터페이스(140)를 통해 DSP(112)에서 수취되고, 이 수취된 신호가 일단, DSP(112)내에 기억되고, 필요에 따라 그 기억된 음성신호가 오디오 인터페이스(140)를 통해 스피커(141)에 공급된다. DSP(112)내의 음성신호처리부는 디지털 카메라로 빔촬영이 행해지는 경우 등에 이용된다. 이상이 CCD고체촬상소자(110)에 의해 얻어진 촬영신호의 흐름이다.
상술한 촬영/재생 전환레버(103)가 촬영측(103a)으로 전환되어, 촬영이 행해질 때의 화상데이터의 흐름을 상세하게 설명한다.
촬영이 행해질 때에는 CPU(11)의 입력부에 접속되어 있는 촬영/재생 전환레버(103)가 촬영측(103a)으로 전환된다.
이러한 디지털 카메라(100)에서는 릴리즈버튼(109)이 눌려져 있지 않아도LCD(105)의 표시화면(105a)에 촬영렌즈가 향해진 방향의 피사체상이 스루화상으로서 항상 표시되어 있다. 이 표시되어 있는 스루화상은 CCD고체촬상소자(110)로부터 소정의 간격마다 판독되는 RGB신호로 이루어지는 화상데이터가 DSP(112)내의 화상신호처리부에서 YC신호로 변환되고, 그 YC신호가 DSP(112)내의 비디오 인코더를 경유해서 LCD(105)에 공급되어 얻어지는 것이다. 이러한 스루화상의 표시가 행해지고 있을 때에는 스루화상마다 DSP(112)에서 노출조절, 초점조절이라는 카메라특유의 신호처리가 행해지고 있다.
여기에서 자신이 원하는 피사체가 LCD화면(105a)에 스루화상으로서 표시되어 있으면, 사용자에 의해 릴리즈버튼(109)이 완전히 눌려진다. 사용자에 의해 릴리즈버튼(109)이 완전히 눌려지면 CPU(111)로부터 TG(116)에 대해서 촬영의 개시지시가 내려진다. 이 개시지시를 받아 CCD고체촬상소자(110)에서는 RGB신호가 출력된다. 또, 상술한 바와 같이 릴리즈버튼(109)에는 반누름과 완전누름의 2개의 조작형태가 있으며, 단숨에 완전누름되었을 때나 릴리즈버튼(109)이 반누름된 상태도 CPU(111)에서는 인식되고, 한순간 반누름상태로 된 시점에서는 촬영스탠바이의 상태로 되어 있다.
이 출력된 RGB신호는 DCS 및 A/D변환부(119)에서 디지털신호로 변환되고, DSP(112)내의 화상입력컨트롤러에 의해 DSP(112)측으로 안내되고, 그 안내된 RGB신호가 DSP(112)내의 버스를 통해 SDRAM(121)에 공급되고, SDRAM(121)에 디지털신호의 RGB신호가 기록된다. 그리고 모든 화상데이터에 대응하는 RGB신호의 입력이 완료되면, 이번에는 SDRAM(121)으로부터 RGB신호가 판독되어 DSP(112)에 공급된다.DSP(112)에서는 RGB신호로부터 YC신호로의 변환이 행해지고, 또한 DSP(121)내에서 압축된 화상데이터가 인터페이스(120)를 통해 기록미디어(130)에 공급되고, 이 기록미디어(130)에 화상데이터가 JPEG압축파일로서 기록된다.
또, DSP(112)와 CPU(111)는 버스에 의해 접속되어 있고, 이 버스를 통해 어드레스, 데이터의 교환이 행해진다. CPU(111)에는 내부에 레지스터가 여러종류 준비되어 있고, 이들 레지스터의 내용이 각 신호처리부의 처리의 진행상황에 따라 변경되어 기록된다. CPU(111)내에서는 이 레지스터의 내용을 판독해서 FLASH ROM(114)내에 저장되어 있는 프로그램의 순서에 따른 처리가 행해진다.
이상이 본 실시형태의 디지털 카메라(100)로 촬영이 행해질 때 기록미디어(130)에 기록될 때까지의 화상데이터의 흐름이다.
본 발명의 디지털 카메라에 있어서는 이하에 나타내듯이 음성조작에 의해 촬영조작 및 화상관리를 행할 수 있도록 되어 있다.
도1 및 도2에 나타내듯이, 디지털 카메라(100)에 내장되어 있는 마이크로폰(150)은 오디오 인터페이스(140)에 접속되고, 이 오디오 인터페이스(140)의 출력은 음성인식부(142)를 통해 DSP(112)에 입력되도록 되어 있다.
도3은 음성에 의한 촬영조작 및 화상관리의 동작의 흐름을 나타내는 플로챠트이다. 촬영시에 릴리즈버튼(109)의 조작 대신에, 마이크로폰(150)으로부터 임의의 음성, 예를 들면 「촬영」이라고 음성입력하면, 음성트리거가 DSP(112)에 입력되고(단계S1), CPU(111)로부터 TG(116)에 대해서 촬영의 개시지시가 내려지고, 이개시지시를 받아서 CCD고체촬상소자(110)에서의 화상입력이 행해지고(단계S2), CCD고체촬상소자(110)로부터 RGB신호가 출력된다.
이 출력된 RGB신호는 신호처리, 즉, CDS 및 A/D변환부(119)에서 디지털신호로 변환되고, DSP(112)내의 화상입력컨트롤러에 의해 DSP(112)측으로 안내되고, 이 안내된 RGB신호가 DSP(112)내의 버스를 통해 SDRAM(121)에 공급되고, SDRAM(121)에 디지털신호의 RGB신호가 기록된다(단계S3). 그리고 모든 화상데이터에 대응하는 RGB신호의 입력이 완료되면, 이번에는 SDRAM(121)으로부터 RGB신호가 판독되어 DSP(112)에 공급된다. DSP(112)에서는 RGB신호로부터 YC신호로의 변환이 행해지고, 또한 DSP(112)내에서 압축된 화상데이터가 인터페이스(120)를 통해 기록미디어(130)에 공급되고(단계S4), 이 기록미디어(130)에 화상데이터가 JPEG압축파일로서 기록된다.
본 발명에서는 기록미디어(130)에 기록할 때의 처리도 음성에 의해 행하는 것이다. 즉, 촬영자는 마이크로폰(150)으로부터의 음성에 의해 화상의 내용을 나타내는 키워드, 예를 들면 가족사진이면 「가족」이라고 발성하고, 친구사진이면 「친구」라고 발성한다(단계S5). 이 음성출력은 오디오 인터페이스(140)로부터 음성인식부(142)에 입력되고, 음성인식부(142)에서 문자열코드로 변환되어 DSP(112)에 입력된다(단계S6). DSP(112)에서는 기록미디어(130)에 상기 문자열코드에 대응하는 명칭코드의 음성데이터용 폴더가 존재하는지의 여부를 판정한다(단계S7). 존재하는 경우에는 그 폴더에 상기 화상을 기록하고(단계S9), 존재하지 않는 경우에는 새로운 폴더를 작성하고(단계S8), 그 후 동일한 처리를 행한다.
도4는 기록미디어(130)의 폴더계층구조의 일례를 나타내는 개념도이다.
포맷된 기록미디어(130)는 루트(root) 아래에 화상(DCIM), 음성(dsam), 이것 이외(MISC)의 폴더가 작성되고, DCIM의 아래에 100fuji, 101fuji, 103fuji라는 4개의 폴더가 가상적으로 준비된다. 100fuji의 폴더에는 화상데이터가 촬영순번에 따라, DSCF0001.jpg, DSCF0002.avi, DSCF0003.wav, DSCF0004.avi, DSCF0005.jpg, DSCF0006.jpg, DSCF0007.jpg, DSCF0008.wav…라는 파일명이 부여되어 있다. 또, 100fuji, 101fuji, 102fuji, 103fuji의 폴더에는 DSCF****(촬영순번).jpg의 파일명이 부여되어 있다.
예를 들면, 마이크로폰(150)으로의 음성입력이 「가족」이면 101fuji의 가족폴더(F1)에, 「친구」이면 102fuji의 친구폴더(F2)에, 「건배」이면 103fuji의 파티폴더(F3)에 각각 촬영화면을 나눈다. 또, 이 경우의 입력음성은 화상내용을 한 단어로 나타내는 키워드이면 어떠한 음성이어도 좋다.
상기 실시형태에서는 기록미디어(130)에 화상을 기록하는 경우의 예를 설명했지만, 기록미디어를 사용하지 않고, 카메라에 내장되어 있는 기억부(도시생략)에 화상을 기록하는 경우에서도 그 기억부의 폴더에 동일하게 해서 음성으로 기록할 수 있다.
이상, 설명한 바와 같이, 본 발명에 의하면, 촬영후의 화상관리를 키조작없이 음성으로 행할 수 있는 디지털 카메라를 제공할 수 있다.

Claims (3)

  1. 촬영렌즈를 경유하여 입사한 피사체광을 고체촬상소자로 포착하여 촬영조작에 따라 화상데이터를 생성하고, 그 화상데이터를 기록부에 기록하는 디지털 카메라에 있어서,
    촬영자의 음성을 집음하는 마이크로폰;
    상기 마이크로폰으로부터 출력되는 음성신호를 인식해서 문자열코드를 출력하는 음성인식부; 및
    상기 음성인식부로부터의 문자열코드에 기초하여 상기 기록부에 상기 문자열코드에 대응하는 폴더의 명칭코드가 존재하는지의 여부를 판정하고, 상기 문자열코드와 명칭코드가 일치할 때 상기 폴더에 화상데이터를 기록하는 처리를 행하는 화상신호처리부를 구비한 것을 특징으로 하는 디지털 카메라.
  2. 제1항에 있어서, 상기 화상신호처리부는 상기 기록부에 상기 문자열코드에 대응하는 명칭코드의 폴더가 존재하지 않는다라고 판정한 경우에는 새롭게 상기 문자열코드에 기초한 명칭코드를 갖는 폴더를 작성한 후 그 폴더에 화상데이터를 기록하는 처리를 행하는 것임을 특징으로 하는 디지털 카메라.
  3. 제1항에 있어서, 상기 마이크로폰에 의해 집음되는 음성은 화상의 내용을 나타내는 키워드인 것을 특징으로 하는 디지털 카메라.
KR1020030089478A 2002-12-12 2003-12-10 디지털 카메라 KR100770637B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2002-00360617 2002-12-12
JP2002360617 2002-12-12

Publications (2)

Publication Number Publication Date
KR20040051528A true KR20040051528A (ko) 2004-06-18
KR100770637B1 KR100770637B1 (ko) 2007-10-29

Family

ID=32588122

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030089478A KR100770637B1 (ko) 2002-12-12 2003-12-10 디지털 카메라

Country Status (4)

Country Link
US (1) US7405754B2 (ko)
KR (1) KR100770637B1 (ko)
CN (1) CN100345056C (ko)
TW (1) TW200421206A (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4018678B2 (ja) * 2004-08-13 2007-12-05 キヤノン株式会社 データ管理方法および装置
JP2006287749A (ja) * 2005-04-01 2006-10-19 Canon Inc 撮像装置、及びその制御方法
JP4498236B2 (ja) * 2005-07-13 2010-07-07 キヤノン株式会社 画像処理装置およびその制御方法
JP4078365B2 (ja) * 2005-07-13 2008-04-23 キヤノン株式会社 画像処理装置およびその制御方法
JP4577173B2 (ja) * 2005-09-29 2010-11-10 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US7792678B2 (en) * 2006-02-13 2010-09-07 Hon Hai Precision Industry Co., Ltd. Method and device for enhancing accuracy of voice control with image characteristic
JP4693651B2 (ja) * 2006-02-20 2011-06-01 キヤノン株式会社 撮像装置及びその制御方法
US20070250526A1 (en) * 2006-04-24 2007-10-25 Hanna Michael S Using speech to text functionality to create specific user generated content metadata for digital content files (eg images) during capture, review, and/or playback process
KR100856407B1 (ko) * 2006-07-06 2008-09-04 삼성전자주식회사 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
EP2629214A1 (en) * 2007-05-11 2013-08-21 Research In Motion Limited Method for storing media captured using a portable electronic device
CN101437115B (zh) * 2007-11-12 2011-01-26 鸿富锦精密工业(深圳)有限公司 数码相机以及图像名称设置方法
US20090265165A1 (en) * 2008-04-21 2009-10-22 Sony Ericsson Mobile Communications Ab Automatic meta-data tagging pictures and video records
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
EP2360905A1 (en) 2009-12-30 2011-08-24 Research In Motion Limited Naming digital images using voice input
US8558919B2 (en) * 2009-12-30 2013-10-15 Blackberry Limited Filing digital images using voice input
JP6504808B2 (ja) * 2014-12-22 2019-04-24 キヤノン株式会社 撮像装置、音声コマンド機能の設定方法、コンピュータプログラム、及び記憶媒体
CN105704389A (zh) * 2016-04-12 2016-06-22 上海斐讯数据通信技术有限公司 一种智能拍照方法及装置
CN107786766A (zh) * 2016-08-29 2018-03-09 河源市新天彩科技有限公司 一种扫描仪的操作方法及扫描仪
CN114387772B (zh) * 2021-12-15 2022-11-25 深圳市东峰盛科技有限公司 一种安防监控用具有警报结构的摄像头

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5697337A (en) * 1979-12-31 1981-08-06 Minolta Camera Co Ltd Voice control camera
US5477511A (en) * 1994-07-13 1995-12-19 Englehardt; C. Duane Portable documentation system
DE59708043D1 (de) * 1996-06-17 2002-10-02 Siemens Ag Kommunikationssystem und Verfahren zur Aufnahme und Verwaltung digitaler Bilder
AU8275698A (en) * 1997-07-02 1999-01-25 Imige Incorporated Mobile telecommunication device for simultaneously transmitting and receiving sound and image data
KR19990054524A (ko) * 1997-12-26 1999-07-15 유무성 디지탈 스틸 카메라의 음성 인식에 따른 모드 설정 장치 및 그방법
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
US6289140B1 (en) * 1998-02-19 2001-09-11 Hewlett-Packard Company Voice control input for portable capture devices
US6847334B2 (en) * 1998-06-29 2005-01-25 William Hayhurst Mobile telecommunication device for simultaneously transmitting and receiving sound and image data
KR100317654B1 (ko) * 1998-11-26 2002-04-24 강상훈 통신수단을이용한운영체제쉘서비스및응용프로그램의음성서비스시스템및그방법
JP3972527B2 (ja) * 1999-08-06 2007-09-05 カシオ計算機株式会社 撮像装置及びフォルダの自動作成方法
JP3978530B2 (ja) 1999-12-07 2007-09-19 富士フイルム株式会社 電子カメラ
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
JP2002057930A (ja) * 2000-05-30 2002-02-22 Fuji Photo Film Co Ltd ディジタル・スチル・カメラおよびその動作制御方法
JP2002165170A (ja) * 2000-11-24 2002-06-07 Canon Inc 撮像装置
KR100368440B1 (ko) * 2000-12-16 2003-01-24 박찬준 음성 인식에 기초한 이동전화 단말기를 이용한 원격 감시시스템 및 이를 이용한 원격 감시 방법
KR20010068063A (ko) * 2001-04-18 2001-07-13 서충기 불루투스를 이용한 무선 비디오 카메라 장치
WO2002091356A1 (fr) * 2001-05-02 2002-11-14 Sony Corporation Dispositif robot, appareil de reconnaissance de caracteres, procede de lecture de caracteres, programme de commande et support d'enregistrement
US20030189642A1 (en) * 2002-04-04 2003-10-09 Bean Heather N. User-designated image file identification for a digital camera
JP3890246B2 (ja) * 2002-04-05 2007-03-07 キヤノン株式会社 撮像装置
US20030204403A1 (en) * 2002-04-25 2003-10-30 Browning James Vernard Memory module with voice recognition system
US20030227553A1 (en) * 2002-06-11 2003-12-11 Steve Mattis Systems and methods for image indexing
KR100450083B1 (ko) * 2002-07-31 2004-09-30 삼성테크윈 주식회사 휴대용 디지털 장치에서 대표-음성을 이용하여데이터-파일들을 관리하는 방법
US20040041921A1 (en) * 2002-08-29 2004-03-04 Texas Instruments Incorporated Voice recognition for file naming in digital camera equipment
KR100493182B1 (ko) * 2002-09-19 2005-06-02 삼성테크윈 주식회사 디지털 카메라에서의 사용자 식별 방법 및 이를 채용한디지털카메라
US20050018057A1 (en) * 2003-07-25 2005-01-27 Bronstein Kenneth H. Image capture device loaded with image metadata
US20050052549A1 (en) * 2003-09-10 2005-03-10 Schinner Charles E. Digital camera and method of using
US7324943B2 (en) * 2003-10-02 2008-01-29 Matsushita Electric Industrial Co., Ltd. Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing

Also Published As

Publication number Publication date
CN100345056C (zh) 2007-10-24
US20040119837A1 (en) 2004-06-24
TW200421206A (en) 2004-10-16
CN1506741A (zh) 2004-06-23
US7405754B2 (en) 2008-07-29
KR100770637B1 (ko) 2007-10-29

Similar Documents

Publication Publication Date Title
KR100770637B1 (ko) 디지털 카메라
US8970762B2 (en) Digital photographing apparatus and method of controlling the same
TW200808044A (en) Imaging apparatus and computer readable recording medium
JP2010219692A (ja) 撮像装置及びカメラ
US7053938B1 (en) Speech-to-text captioning for digital cameras and associated methods
JP2008206018A (ja) 撮像装置およびプログラム
JP2007221570A (ja) 撮像装置及びそのプログラム
JP2007310813A (ja) 画像検索装置およびカメラ
CN101076086B (zh) 场景选择画面生成装置
JP4595832B2 (ja) 撮像装置、プログラム、及び記憶媒体
JP2005117369A (ja) 動画記録装置および動画再生装置並びにデジタルカメラ
JP2008085582A (ja) 画像管理システム、撮影装置、画像管理サーバ、および画像管理方法
JP5023932B2 (ja) 撮像装置、シナリオによる画像撮影方法、およびプログラム
JP2007174278A (ja) 画像表示装置、画像表示方法
CN109257544B (zh) 图像记录装置、图像记录方法以及记录介质
JP2009088688A (ja) 撮像装置及びその撮像方法並びにその設定切替方法
JP2004208276A (ja) 撮像装置
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP2006237963A (ja) 画像表示装置、撮影装置及び画像表示方法
KR101156683B1 (ko) 디지털 이미지 처리장치의 분할촬영 방법
JP2003333470A (ja) デジタルカメラのデータ管理方法
KR101058033B1 (ko) 분할촬영 방법, 재생방법 및 이를 수행하는 디지털 이미지처리장치
JP4485455B2 (ja) カラオケシステム、楽曲設定方法及び撮影装置
KR101946574B1 (ko) 영상 재생 장치, 방법, 및 컴퓨터 판독가능 저장매체
JP2012129659A (ja) 撮像装置、動作制御方法及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E801 Decision on dismissal of amendment
B601 Maintenance of original decision after re-examination before a trial
N231 Notification of change of applicant
S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121002

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131001

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141007

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150917

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170920

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20181004

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20191002

Year of fee payment: 13