JP2013534741A - 画像記録再生装置、及び画像記録再生方法 - Google Patents
画像記録再生装置、及び画像記録再生方法 Download PDFInfo
- Publication number
- JP2013534741A JP2013534741A JP2013512769A JP2013512769A JP2013534741A JP 2013534741 A JP2013534741 A JP 2013534741A JP 2013512769 A JP2013512769 A JP 2013512769A JP 2013512769 A JP2013512769 A JP 2013512769A JP 2013534741 A JP2013534741 A JP 2013534741A
- Authority
- JP
- Japan
- Prior art keywords
- image recording
- image
- reproducing apparatus
- text data
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000003384 imaging method Methods 0.000 claims abstract description 17
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 230000003213 activating effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 4
- 230000004913 activation Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B31/00—Associated working of cameras or projectors with sound-recording or sound-reproducing means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Studio Devices (AREA)
- Television Signal Processing For Recording (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】本発明に係る画像記録再生装置は、画像を撮影する撮像系と、撮像系と結合され、撮影画像をデジタル画像ファイルとして処理する信号処理部と、信号処理部と結合され、デジタル画像ファイルと関連する少なくとも一の音声注釈を取得するオーディオ系と、少なくとも一の音声注釈を認識し、音声注釈をテキストデータに変換する音声認識部と、を備え、音声認識部は、信号処理部と連携し、テキストデータを使ってメタデータを生成し、生成されたメタデータをデジタル画像ファイルに追加する、画像記録再生装置であって、音声認識部は、複数の単語サブセットを備え、各サブセットは、対応する複数の言語から取得された音声注釈を認識し、テキストに変換するために、限定された数の単語を有する。
【選択図】図2
Description
- デジタル画像ファイルの種類を示すための文字の組み合わせ(例えば、“DSC”、“IMG”、“PICT”、“DSCN”等)
- デジタル画像を他のデジタル画像と区別するために、上述の文字の組み合わせに、付加する数字の序列(例えば、“001”、“002”等)
- 画像の種類を示すために、数字の序列の後に付加するファイル拡張子(例えば、“.TIF”、“.JPG”等)
- 画像を撮影し、画像データを生成するために撮影された画像を処理し、画像データを備える画像ファイルを生成する信号処理部と、
- 言語を認識し、言語をテキストデータに変換する音声認識部と、
- テキストデータを使用してメタデータを生成し、生成したメタデータファイルに追加する制御部と、
を備える。
- 画像を撮影する撮像系10と、
- 撮像系10に連結し、撮影画像をデジタル画像ファイルとして処理する信号処理部20と、
信号処理部20と連結し、デジタル画像ファイルと関連すると想定される、少なくとも一つの音声注釈を取得するオーディオ系30と、
- 少なくとも一つの音声注釈を認識し、認識した音声注釈をテキストデータに変換する音声認識部40と、を備え、
- 音声認識部40は、信号処理部20と連携して、テキストデータを使ってメタデータを生成し、生成されたメタデータをデジタル画像ファイルに追加する。
- IIM(IPTC Information Interchange Model、IPTC(International Press Telecommunication Councils))フォーマット、
- IPTC Core Schema for XMP(Extensible Metadata Platform)(Adobe社の標準フォーマット)、
- EXIF(Exchangeable image file format)フォーマット。EXIFフォーマットは、CIPA(Camera & Imaging Products Association)によって維持され、かつJEITA(Japan Electronics and Information Technology Industries Association)によって発行されているフォーマットである。
- Dublin Coreフォーマット(DCMI(Dublin Core Metadata Initiative)フォーマット)、
- PLUS(Picture Licensing Universal System)フォーマット。
- 地理的な場所を表す単語(例えば、“海”、“砂漠”、“丘”、“山”、“湖”等)
- 世界中の国を表す単語(例えば、“ドイツ”、“フランス”、“イタリア”、“アメリカ合衆国”、“日本”、“中国”、“韓国”等)、及びこれらの国の主要都市(例えば、“フランクフルト”、“ミュンヘン”、“パリ”、“ローマ”、“ロサンジェルス”、“ラスベガス”、“東京”、“上海”、“香港”、“マカオ”、“ソウル”等)。さらに、これらの都市の有名な建造物、芸術作品(例えば、“万里の長城”、“カジノ”、“コロセウム”、“エッフェル塔”等)
- 季節を表す単語(例えば、“春”、“夏”、“秋”、“冬”等)、及び/又は月を表す単語、及び/又は曜日を表す単語
- 数字を表す単語、特に、数字を組み合わせるために、0〜9を表す単語
- 人との関係を表す単語(例えば、“兄(又は弟)”、“姉(又は妹)”、“父”、“母”、“祖父”、“祖母”、“叔父”、“叔母”、“従妹”、“友達”、“夫”、“妻”等)
- 人名を表す単語(例えば、“カール(Carl)”、“ポール(Paul)”、“ピーター(Peter)”、“ジョン(John)”、“ロバート(Robert)”、“アビー(Abbie)”、“ジェーン(Jane)”、“マリー(Mary)”、“ベス(Beth)”等)
- 動物を表す単語(例えば、“犬”、“猫”、“馬”、“鳥”等)、及び/又は物を表す単語(“家”、“来訪所”、“庭”、“教会”、“大聖堂”、“車”、“バイク”等)
特に、
- 撮影されるべき画像を、ユーザに対して表示する目的。その場合、表示部60は、ユーザが、画面中央で、画像、及び画像内でポーズをとる人に焦点を合わせられるようにする等ができる。
- デジタル画像ファイルとしてメモリ50に記録された撮影画像を表示する目的。
- ユーザに情報を伝えるメニューを表示する目的。
- 画像記録再生装置1の機能を選択する目的。
- 画像記録再生装置1の処理を制御する目的等。
- 対応する複数の言語から取得した、音声注釈を認識し、テキストに変換する音声認識部40に、限定された数の、複数の単語サブセット41を製造サイトで保存する工程(ステップ150)と、
- 撮像系10を備える画像記録再生装置1によって、画像を撮影する工程(ステップ100)と、
- 撮像系10に連結された信号処理部20を介して、撮影画像をデジタル画像ファイルとして処理する工程(ステップ110)と、
- 信号処理部20に連結されたオーディオ系30の方法によって、特にメモリ50に、デジタル画像ファイルに関連すると想定される、少なくとも一の音声注釈を記録する工程(ステップ120)と、
- 信号処理部20に連携された音声認識部40によって、少なくとも一の音声注釈を認識し、音声注釈をテキストデータに変換する工程(ステップ130)と、
- テキストデータを使用してメタデータを生成し、生成されたメタデータをデジタル画像ファイルに追加する工程(ステップ140)と、
を含む。
10 撮像系
11 レンズ/シャッター機構
12 センサ
20 信号処理部
30 オーディオ系
31 マイク
32 スピーカ
40 音声認識部
41 単語サブセット
42 起動手段
50 メモリ
60 表示部
本発明の一視点において画像記録再生装置が提供される。該装置において本発明にしたがい、画像を撮影する撮像系と、
前記撮像系と連結され、前記撮影画像をデジタル画像ファイルとして処理する信号処理部と、
前記信号処理部と連結され、前記デジタル画像ファイルと関連するよう適合された少なくとも一の音声注釈を取得するオーディオ系と、
少なくとも一の前記音声注釈を認識し、前記音声注釈をテキストデータに変換する音声認識部と、を備え、前記音声認識部は、信号処理部と連携して、前記テキストデータを使ってメタデータを生成し、生成された前記メタデータを前記デジタル画像ファイルに追加する、画像記録再生装置であって、
前記音声認識部は、複数の単語サブセットを備え、各サブセットは、対応する複数の言語から取得された音声注釈を認識し、テキストに変換するために、限定された数の単語を有し、
各前記単語サブセットは、所定の画像に関して、製造サイトで、頻繁に使用される単語のうち、限定された単語数の所定の言語を選択し、記憶して、限定された単語数について、所定の言語に対する関連する翻訳(relative translation)を備える。(形態1)
本発明において、以下の展開形態が可能である。
(形態2)画像記録再生装置において、前記音声認識部は、前記音声注釈をテキストデータに変換するために、ユーザに当該音声認識部を起動させる起動手段に連携することが好ましい。
(形態3)画像記録再生装置において、前記デジタル画像ファイル、及び/又は前記音声注釈、及び/又はテキストデータに変換された音声注釈を保存する、信号処理部に連結するメモリを備えることが好ましい。
(形態4)画像記録再生装置において、前記信号処理部と連携する表示部を備えることが好ましい。
(形態5)画像記録再生装置において、画像記録再生装置の操作を表示するための複数の言語から言語を選択し、かつ限定された単語数の言語サブセットの一つを選択するよう適合されたOSD(On Screen Display)システムを備える前記表示部を備えることが好ましい。
(形態6)画像記録再生装置において、前記テキストデータを使用してメタデータを生成し、所定の国際基準に従って、前記メタデータを符号化することが好ましい。
本発明の第2の視点において、下記の画像記録再生方法が提供される。この画像記録再生方法は、撮像系を備える画像記録再生装置によって、画像を撮影する工程と、
前記撮像系に連結する信号処理部を介して、撮影画像をデジタル画像ファイルとして処理する工程と、
前記信号処理部に連結するオーディオ系によって、前記デジタル画像ファイルと関連するよう適合された、少なくとも一の音声注釈を、特にメモリに記録する工程と、
前記信号処理部に関連する音声認識部によって、前記音声注釈を認識し、少なくとも一の前記音声注釈をテキストデータに変換する工程と、
前記テキストデータを使用してメタデータを生成し、生成された前記メタデータを前記デジタル画像ファイルに追加する工程と、
を含み、
少なくとも一の前記音声注釈を認識し、前記音声注釈をテキストデータに変換する工程は、対応する複数の言語から取得された音声注釈を認識し、テキストデータに変換する音声認識部に、限定された単語数の複数の単語サブセットを製造サイトで保存する工程によって実行される。(形態7)
(形態8)画像記録再生方法において、前記音声注釈をテキストデータに変換するために、ユーザに前記音声認識部を起動させる、前記音声認識部の起動手段を起動する工程を含むことが好ましい。
(形態9)画像記録再生方法において、前記起動手段を起動する前記工程は、撮影画像を処理する工程の後に実行されることが好ましい。
(形態10)画像記録再生方法において、前記起動手段を起動する前記工程は、画像を撮影する工程の前に実行されることが好ましい。
(形態11)画像記録再生方法において、前記起動手段を起動する前記工程は、慣習的なファイル名の画像を生成する工程に先立って実行されることが好ましい。
(形態12)画像記録再生方法において、前記表示部に備わるOSD(On Screen Display)システムによって、前記画像記録再生装置の操作内容を表示する複数の言語から言語を選択し、かつ限定された単語数の前記単語サブセットの一つを選択する工程を含むことが好ましい。
(形態13)画像記録再生方法において、言語を選択し、限定された単語数のサブセットを選択する工程は、画像を撮影する工程の前に実行されることが好ましい。
(形態14)画像記録再生方法において、言語を選択し、限定された単語数のサブセットを選択する工程は、前記起動手段を起動する工程の後に実行されることが好ましい。
本発明の第3の視点において、形態7乃至14のいずれか一に記載の手段を実行するためのコンピュータプログラム製品が提供される。(形態15)
(形態16)形態15のコンピュータプログラム製品に関連する読み込み可能な記録媒体/データキャリアが提供される。
なお、特許請求の範囲に付記した図面参照番号はもっぱら理解を助けるためであり、図示の態様に限定することを意図するものではない。
Claims (17)
- 画像を撮影する撮像系(10)と、
前記撮像系(10)と連結され、前記撮影画像をデジタル画像ファイルとして処理する信号処理部(20)と、
前記信号処理部(20)と連結され、前記デジタル画像ファイルと関連するよう適合された少なくとも一の音声注釈を取得するオーディオ系(30)と、
少なくとも一の前記音声注釈を認識し、前記音声注釈をテキストデータに変換する音声認識部(40)と、を備え、前記音声認識部(40)は、信号処理部(20)と連携し、前記テキストデータを使ってメタデータを生成し、生成された前記メタデータを前記デジタル画像ファイルに追加する、画像記録再生装置(1)であって、
前記音声認識部(40)は、複数の単語サブセット(41)を備え、各サブセット(41)は、対応する複数の言語から取得された音声注釈を認識し、テキストに変換するために、限定された数の単語を有する、
ことを特徴とする画像記録再生装置(1)。 - 各前記単語サブセット(41)は、所定の画像に関して、製造サイトで、頻繁に使用される単語のうち、限定された単語数の所定の言語を選択し、記憶して、限定された単語数について、所定の言語に対する関連する翻訳(relative translation)を備える請求項1に記載の画像記録再生装置(1)。
- 前記音声認識部(40)は、前記音声注釈をテキストデータに変換するために、ユーザに当該音声認識部(40)を起動させる、起動手段(42)に連携する請求項1又は2に記載の画像記録再生装置(1)。
- 前記デジタル画像ファイル、及び/又は前記音声注釈、及び/又はテキストデータに変換された前記音声注釈を保存する前記信号処理部(20)に連結するメモリ(50)を備える請求項1に記載の画像記録再生装置(1)。
- 前記信号処理部(20)と連携する表示部(60)を備える請求項1に記載の画像記録再生装置(1)。
- 画像記録再生装置(1)の操作を表示するための複数の言語から言語を選択し、かつ言語サブセット(41)の一つを選択するよう適合されたOSD(On Screen Display)システムを備える前記表示部(60)を備える請求項5に記載の画像記録再生装置(1)。
- 前記テキストデータを使用してメタデータを生成し、所定の国際基準に従って、前記メタデータを符号化する請求項1に記載の画像記録再生装置(1)。
- 撮像系(10)を備える画像記録再生装置(1)の画像を撮影する工程(ステップ100)と、
前記撮像系(10)に連結する信号処理部(20)を介して、撮影画像をデジタル画像ファイルとして処理する工程(ステップ110)と、
前記信号処理部(20)に連結するオーディオ系(30)によって、前記デジタル画像ファイルと関連するよう適合された、少なくとも一の音声注釈を、特にメモリ(50)に記録する工程(ステップ120)と、
前記信号処理部(20)に関連する音声認識部(40)によって、前記音声注釈を認識し、少なくとも一の前記音声注釈をテキストデータに変換する工程(ステップ130)と、
前記テキストデータを使用してメタデータを生成し、生成された前記メタデータを前記デジタル画像ファイルに追加する工程(ステップ140)と、
を含む画像記録再生方法であって、
少なくとも一の前記音声注釈を認識し、前記音声注釈をテキストデータに変換する工程(ステップ130)は、対応する複数の言語から取得された音声注釈を認識し、テキストデータに変換する音声認識部(40)に、限定された単語数の、複数の単語サブセット(41)を製造サイトで保存する工程(ステップ150)によって実行される、
ことを特徴とする画像記録再生方法。 - 前記音声注釈をテキストデータに変換するために、ユーザに前記音声認識部(40)を起動させる、前記音声認識部(40)の起動手段(42)を起動する工程(ステップ160)を含む請求項8に記載の画像記録再生方法。
- 前記起動手段(42)を起動する前記工程(ステップ160)は、撮影画像を処理する工程(ステップ110)の後に実行される請求項9に記載の画像記録再生方法。
- 前記起動手段(42)を起動する前記工程(ステップ160)は、画像を撮影する工程(ステップ100)の前に実行される請求項9に記載の画像記録再生方法。
- 前記起動手段(42)を起動する前記工程(ステップ160)は、慣習的なファイル名の画像を生成する工程(ステップ161)に先立って実行される請求項11に記載の画像記録再生方法。
- 前記画像記録再生装置(1)を操作するために表示する複数の言語から言語を選択し、かつ前記表示部(60)に備わるOSD(On Screen Display)システムによって、限定された単語数の前記単語サブセット(41)の一つを選択する工程(ステップ180)を含む請求項8に記載の画像記録再生方法。
- 言語を選択し、限定された単語数のサブセットを選択する前記工程(ステップ180)は、画像を撮影する工程(ステップ100)の前に実行される請求項13に記載の画像記録再生方法。
- 言語を選択し、限定された単語数のサブセットを選択する前記工程(ステップ180)は、前記起動手段(42)を起動する工程(ステップ160)の後に実行される請求項13に画像記録再生方法。
- 請求項8乃至15のいずれか一に記載の手段を実行するためのコンピュータプログラム製品。
- 請求項16のコンピュータプログラム製品に関連する読み込み可能な記録媒体/データキャリア。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2010/057747 WO2011150969A1 (en) | 2010-06-02 | 2010-06-02 | Apparatus for image data recording and reproducing, and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013534741A true JP2013534741A (ja) | 2013-09-05 |
Family
ID=43016538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013512769A Pending JP2013534741A (ja) | 2010-06-02 | 2010-06-02 | 画像記録再生装置、及び画像記録再生方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130155277A1 (ja) |
EP (1) | EP2577654A1 (ja) |
JP (1) | JP2013534741A (ja) |
KR (1) | KR20130095659A (ja) |
CN (1) | CN102918586B (ja) |
WO (1) | WO2011150969A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130120594A1 (en) * | 2011-11-15 | 2013-05-16 | David A. Krula | Enhancement of digital image files |
US8768693B2 (en) * | 2012-05-31 | 2014-07-01 | Yahoo! Inc. | Automatic tag extraction from audio annotated photos |
CN104679724A (zh) * | 2013-12-03 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 页面注释方法及装置 |
CN107870713B (zh) * | 2016-09-27 | 2020-10-16 | 洪晓勤 | 具有兼容性的图文一体化的图片处理方法 |
JP7042167B2 (ja) * | 2018-06-13 | 2022-03-25 | 本田技研工業株式会社 | 車両制御装置、車両制御方法、およびプログラム |
JPWO2021039057A1 (ja) * | 2019-08-29 | 2021-03-04 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0876288A (ja) * | 1994-08-30 | 1996-03-22 | Eastman Kodak Co | カメラに内蔵された音声メッセージ記録装置 |
JPH09500223A (ja) * | 1993-07-13 | 1997-01-07 | ボルドー、テオドール・オースチン | 多言語音声認識システム |
JP2001075777A (ja) * | 1999-09-03 | 2001-03-23 | Sony Corp | 情報処理装置および方法、並びにプログラム格納媒体 |
JP2002325225A (ja) * | 2001-01-31 | 2002-11-08 | Internatl Business Mach Corp <Ibm> | テキスト形式の説明によってディジタル・イメージの質を向上させるための方法及び装置 |
JP2004301894A (ja) * | 2003-03-28 | 2004-10-28 | Fuji Photo Film Co Ltd | 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置 |
JP2006030874A (ja) * | 2004-07-21 | 2006-02-02 | Fuji Photo Film Co Ltd | 画像記録装置 |
JP2006133433A (ja) * | 2004-11-05 | 2006-05-25 | Fuji Photo Film Co Ltd | 音声/文字変換システムならびに携帯型端末装置および変換サーバならびにそれらの制御方法 |
JP2007052626A (ja) * | 2005-08-18 | 2007-03-01 | Matsushita Electric Ind Co Ltd | メタデータ入力装置およびコンテンツ処理装置 |
JP2009237439A (ja) * | 2008-03-28 | 2009-10-15 | Kddi Corp | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4036528B2 (ja) * | 1998-04-27 | 2008-01-23 | 富士通株式会社 | 意味認識システム |
US6462778B1 (en) * | 1999-02-26 | 2002-10-08 | Sony Corporation | Methods and apparatus for associating descriptive data with digital image files |
JP2003178067A (ja) * | 2001-12-10 | 2003-06-27 | Mitsubishi Electric Corp | 携帯端末型画像処理システム、携帯端末およびサーバ |
US20050118990A1 (en) * | 2003-12-02 | 2005-06-02 | Sony Ericsson Mobile Communications Ab | Method for audible control of a camera |
GB2409365B (en) * | 2003-12-19 | 2009-07-08 | Nokia Corp | Image handling |
JP2006163877A (ja) * | 2004-12-08 | 2006-06-22 | Seiko Epson Corp | メタデータ生成装置 |
US20070236583A1 (en) * | 2006-04-07 | 2007-10-11 | Siemens Communications, Inc. | Automated creation of filenames for digital image files using speech-to-text conversion |
US8502876B2 (en) * | 2006-09-12 | 2013-08-06 | Storz Endoskop Producktions GmbH | Audio, visual and device data capturing system with real-time speech recognition command and control system |
JP4896838B2 (ja) * | 2007-08-31 | 2012-03-14 | カシオ計算機株式会社 | 撮像装置、画像検出装置及びプログラム |
JP4962783B2 (ja) * | 2007-08-31 | 2012-06-27 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US20090298529A1 (en) * | 2008-06-03 | 2009-12-03 | Symbol Technologies, Inc. | Audio HTML (aHTML): Audio Access to Web/Data |
US20100238323A1 (en) * | 2009-03-23 | 2010-09-23 | Sony Ericsson Mobile Communications Ab | Voice-controlled image editing |
US8558919B2 (en) * | 2009-12-30 | 2013-10-15 | Blackberry Limited | Filing digital images using voice input |
US20130120594A1 (en) * | 2011-11-15 | 2013-05-16 | David A. Krula | Enhancement of digital image files |
-
2010
- 2010-06-02 EP EP10726032.5A patent/EP2577654A1/en not_active Withdrawn
- 2010-06-02 CN CN201080067121.8A patent/CN102918586B/zh active Active
- 2010-06-02 JP JP2013512769A patent/JP2013534741A/ja active Pending
- 2010-06-02 US US13/700,922 patent/US20130155277A1/en not_active Abandoned
- 2010-06-02 WO PCT/EP2010/057747 patent/WO2011150969A1/en active Application Filing
- 2010-06-02 KR KR1020127034321A patent/KR20130095659A/ko not_active Application Discontinuation
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09500223A (ja) * | 1993-07-13 | 1997-01-07 | ボルドー、テオドール・オースチン | 多言語音声認識システム |
JPH0876288A (ja) * | 1994-08-30 | 1996-03-22 | Eastman Kodak Co | カメラに内蔵された音声メッセージ記録装置 |
JP2001075777A (ja) * | 1999-09-03 | 2001-03-23 | Sony Corp | 情報処理装置および方法、並びにプログラム格納媒体 |
JP2002325225A (ja) * | 2001-01-31 | 2002-11-08 | Internatl Business Mach Corp <Ibm> | テキスト形式の説明によってディジタル・イメージの質を向上させるための方法及び装置 |
JP2004301894A (ja) * | 2003-03-28 | 2004-10-28 | Fuji Photo Film Co Ltd | 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置 |
JP2006030874A (ja) * | 2004-07-21 | 2006-02-02 | Fuji Photo Film Co Ltd | 画像記録装置 |
JP2006133433A (ja) * | 2004-11-05 | 2006-05-25 | Fuji Photo Film Co Ltd | 音声/文字変換システムならびに携帯型端末装置および変換サーバならびにそれらの制御方法 |
JP2007052626A (ja) * | 2005-08-18 | 2007-03-01 | Matsushita Electric Ind Co Ltd | メタデータ入力装置およびコンテンツ処理装置 |
JP2009237439A (ja) * | 2008-03-28 | 2009-10-15 | Kddi Corp | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2577654A1 (en) | 2013-04-10 |
CN102918586B (zh) | 2015-08-12 |
KR20130095659A (ko) | 2013-08-28 |
CN102918586A (zh) | 2013-02-06 |
US20130155277A1 (en) | 2013-06-20 |
WO2011150969A1 (en) | 2011-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100856407B1 (ko) | 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법 | |
US8462231B2 (en) | Digital camera with real-time picture identification functionality | |
US20070236583A1 (en) | Automated creation of filenames for digital image files using speech-to-text conversion | |
KR101720774B1 (ko) | 디지털 촬영 장치 및 그의 사진 제공 방법 | |
US20120062766A1 (en) | Apparatus and method for managing image data | |
JP2013534741A (ja) | 画像記録再生装置、及び画像記録再生方法 | |
CN104580888A (zh) | 一种图像处理方法及终端 | |
US9973649B2 (en) | Photographing apparatus, photographing system, photographing method, and recording medium recording photographing control program | |
TW200816178A (en) | Recording device and method, imaging device, reproduction device and method, and program | |
WO2015074203A1 (zh) | 一种图片展示方法及装置、终端设备 | |
JP2013090267A (ja) | 撮像装置 | |
US20150324395A1 (en) | Image organization by date | |
US20090002497A1 (en) | Digital Camera Voice Over Feature | |
JP2009081785A (ja) | 撮像装置、画像生成方法、およびプログラム | |
JP5173666B2 (ja) | カメラ | |
JP2008102845A (ja) | 情報処理装置および方法、並びにプログラム | |
JP5372219B2 (ja) | 画像送信機能付きカメラ及び画像送信方法 | |
JP4930343B2 (ja) | ファイル生成装置、ファイル生成方法およびプログラム | |
JP2005260355A (ja) | 重要度付加装置、重要度情報生成方法、電子アルバム作成装置、電子アルバム作成方法、及びプログラム | |
KR20230008687A (ko) | 스마트폰에서 사진 자동 레이블링 및 녹음 장치 및 방법 | |
JP2007214873A (ja) | フォトスタジオにおける撮影画像提供方法 | |
JP2007065897A (ja) | 撮像装置及びその制御方法 | |
TWI510940B (zh) | 以語音訊號建立備註資料之影像瀏覽裝置及其方法 | |
JP6107897B2 (ja) | 画像情報処理装置及びプログラム | |
JP5613223B2 (ja) | 撮影システムの表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130530 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130530 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140818 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150303 |