JP4753605B2 - 音声ファイル処理装置 - Google Patents
音声ファイル処理装置 Download PDFInfo
- Publication number
- JP4753605B2 JP4753605B2 JP2005104951A JP2005104951A JP4753605B2 JP 4753605 B2 JP4753605 B2 JP 4753605B2 JP 2005104951 A JP2005104951 A JP 2005104951A JP 2005104951 A JP2005104951 A JP 2005104951A JP 4753605 B2 JP4753605 B2 JP 4753605B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- sample data
- audio file
- audio
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
この様な音声ファイル蓄積装置においては、音声ファイルを選択する際の音声ファイルの判別を容易なものとするために、ディスプレイの画面に各音声ファイルの内容を視覚的に表わすアイコン(ラベル)を表示するものが知られており(特許文献1参照)、この様な音声ファイル蓄積装置においては、画面に表示されている複数のアイコンの中から特定のアイコンをクリックすれば、そのアイコンに関連付けられている音声ファイルが読み出されることになる。
従って、予め作成されている音声ファイルに対して新たに画像を関連付けることが出来ない問題があった。
複数種類の音声についての標本データが予め格納されている標本データ格納手段と、
標本データ格納手段に格納されている複数の標本データのそれぞれについて、標本データによって表わされる音声の種類に関連した要素画像が予め格納されている画像格納手段と、
入力された音声ファイルに含まれる音声データを解析し、標本データ格納手段に格納されている複数の標本データの内、入力された音声ファイルに含まれる音声データとの一致度に応じて1或いは複数の標本データを特定するデータ特定手段と、
特定された1或いは複数の標本データに対応する1或いは複数の要素画像を前記画像格納手段から読み出し、読み出した1或いは複数の要素画像を用いて標章画像を生成し、該標章画像を入力された音声ファイルと関連付ける画像関連付け手段
とを具えている。
その後、特定された1或いは複数の標本データに対応する1或いは複数の要素画像が、前記画像格納手段から読み出され、読み出された1或いは複数の要素画像を用いて1枚の標章画像が生成され、該標章画像が、入力された音声ファイルと1対1に関連付けられる。
そして、前記データ特定手段は、音声タイプ標本データテーブルから、入力された音声ファイルに含まれる音声データと最も一致度の高い1或いは複数の音声タイプ標本データを特定すると共に、入力された音声ファイルに含まれる音声データと最も一致度の高い1或いは複数の録音状況標本データを特定する。
又、前記画像関連付け手段は、前記特定された1或いは複数の音声タイプ標本データに対応する1或いは複数の要素画像を前記画像格納手段から読み出し、読み出した1或いは複数の要素画像を、前記特定された1或いは複数の録音状況標本データによって表わされる録音状況に応じて合成することにより、1枚の標章画像を生成する。
次に、画像関連付け手段によって、前記特定された1或いは複数の音声タイプ標本データに対応する1或いは複数の要素画像が前記画像格納手段から読み出され、読み出された1或いは複数の要素画像が、前記特定された1或いは複数の録音状況標本データによって表わされる録音状況に応じて合成される。例えば、画像格納手段には、男性を表わす要素画像、女性を表わす要素画像、犬を表わす要素画像などが格納されており、録音状況が会議であれば、男性を表わす1或いは複数の要素画像と女性を表わす1或いは複数の要素画像とを円陣に配列した1枚の標章画像が生成される。
従って、上記標章画像を参照することにより、ユーザは、その音声ファイルに含まれる音声データが、どの様なタイプの音声で、どの様な状況で録音されたかを視覚的に認識することが出来、これによって容易に音声ファイルを判別することが出来る。
本発明に係る音声ファイル蓄積システムは、図1に示す如く、音声再生機能と画像表示機能を有する音声ファイル処理装置(10)に対し、複数の音声ファイルを蓄積するためのハードディスク装置等の外部記憶装置(1)を接続して構成されている。
音声タイプ標本データテーブル(8)には、音声の質に応じた音声タイプ(例えば、男性の声、女性の声、車の音、笛の音、犬の鳴き声、猫の鳴き声など)毎に分類された複数の音声タイプ標本データSAMPLET[0]〜SAMPLET[MAXT]が含まれている。一方、録音状況標本データテーブル(9)には、音声が録音された状況(例えば、会議、公園、図書館、雑踏、砂浜、船上など)毎に分類された複数の録音状況標本データSAMPLES[0]〜SAMPLEs[MAXS]が含まれている。
先ず図2のステップS1にて、1つの音声ファイルに含まれる解析対象の音声データを複数のデータブロックDATA[0]〜DATA[MAXD]に時分割する。
次に、ステップS4では、フーリエ解析の結果と音声タイプ標本データSAMPLET[J]とが一致している割合(一致度)を算出し、その結果を一致度変数BUF[J]に代入する。
次にステップS8では、最大一致度BUF[A]が所定の閾値を越えているか否かを判断し、イエスと判断されたときはステップS9に移行し、ノーと判断されたときはステップS10に移行する。
ステップS10では、データブロックDATA[I]に対する標本データは存在しないと判断し、解析結果データRESULTT[I]にNULLを代入する。
この結果、入力された1つの音声ファイルについての解析結果データRESULTT[0]〜RESULTT[MAXD]が得られることになる。
そして、ステップS15では、フーリエ解析の結果と録音状況標本データSAMPLES[I]とが一致している割合(一致度)を算出し、その結果を一致度変数BUF[I]に代入する。
次にステップS19では、最大一致度BUF[B]に対応する録音状況標本データの識別番号を状況の解析結果として、解析結果データRESULTSに代入する。
続いて、ステップS21では、アイコン格納部ICONのデータを解析結果データRESULTSの識別番号に対応する画像操作方法に従って、標章画像の生成を行ない、生成された標章画像ファイルを元の音声ファイルの音声データに関連付ける。
そこで、ユーザが複数の標章画像の中から目的の音声ファイルであると思われる1つの標章画像を選択すると、その標章画像と関連付けられている音声ファイルが読み出され、音声が再生されることになる。
又、入力された音声ファイルに含まれる音声データと標本データとの一致度は、両データの相関係数を算出する方法や両データの周波数特性を比較する方法等、周知の種々の方法を用いて導出することが可能である。
(10) 音声ファイル処理装置
(2) CPU
(3) メモリ
(8) 音声タイプ標本データテーブル
(9) 録音状況標本データテーブル
(11) アイコン
(12) アイコン
(13) 標章画像
(14) アイコン
(15) アイコン
(16) 標章画像
(18) アイコン
(19) 標章画像
Claims (1)
- 一連の音声データを含む音声ファイルの入力に応じて、入力された音声ファイルに含まれる音声データに関連する画像を作成し、その画像を該音声ファイルに対応づける音声ファイル処理装置であって、
複数種類の音声についての標本データが予め格納されている標本データ格納手段と、
標本データ格納手段に格納されている複数の標本データのそれぞれについて、標本データによって表わされる音声の種類に関連した要素画像が予め格納されている画像格納手段と、
入力された音声ファイルに含まれる音声データを解析し、標本データ格納手段に格納されている複数の標本データの内、入力された音声ファイルに含まれる音声データとの一致度に応じて複数の標本データを特定するデータ特定手段と、
入力された音声ファイルに含まれる音声データを解析することによって当該音声ファイルが録音された際の周囲の状況を判別する録音状況判別手段と、
特定された複数の標本データに対応する複数の要素画像を前記画像格納手段から読み出し、読み出した複数の要素画像を用いて録音状況判別手段によって判別された録音状況に応じて合成し標章画像を生成し、該標章画像を入力された音声ファイルと関連付ける画像関連付け手段
とを具えていることを特徴とする音声ファイル処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005104951A JP4753605B2 (ja) | 2005-03-31 | 2005-03-31 | 音声ファイル処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005104951A JP4753605B2 (ja) | 2005-03-31 | 2005-03-31 | 音声ファイル処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006285653A JP2006285653A (ja) | 2006-10-19 |
JP4753605B2 true JP4753605B2 (ja) | 2011-08-24 |
Family
ID=37407511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005104951A Expired - Fee Related JP4753605B2 (ja) | 2005-03-31 | 2005-03-31 | 音声ファイル処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4753605B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3150246B2 (ja) * | 1993-12-09 | 2001-03-26 | キヤノン株式会社 | データ管理方法及び装置 |
JP2003216175A (ja) * | 2002-01-25 | 2003-07-30 | Fuji Photo Film Co Ltd | プログラム、音声ファイル管理装置、及び音声ファイル管理方法 |
-
2005
- 2005-03-31 JP JP2005104951A patent/JP4753605B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006285653A (ja) | 2006-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101202864B (zh) | 动画再现装置 | |
US8589402B1 (en) | Generation of smart tags to locate elements of content | |
EP2083363A1 (en) | Content display apparatus for displaying media according to media categories | |
CN101002200A (zh) | 用于封装媒体对象的代表性样本的***和方法 | |
JP2011170690A (ja) | 情報処理装置、情報処理方法、およびプログラム。 | |
KR101268987B1 (ko) | 메타데이터를 자동적으로 생성/갱신하는 멀티미디어 데이터기록 방법 및 장치 | |
JP2003209771A (ja) | デジタル映像再生装置及び再生方法 | |
JP2008022103A (ja) | テレビ番組動画像ハイライト抽出装置及び方法 | |
US6278497B1 (en) | Moving picture processing method and apparatus, and computer program product having processing procedure recorded therefore | |
JP2003259316A (ja) | ストリーム処理システムおよびストリーム処理プログラム | |
JP2004153764A (ja) | メタデータ制作装置及び検索装置 | |
JP4753605B2 (ja) | 音声ファイル処理装置 | |
JP2012053855A (ja) | コンテンツ閲覧装置、コンテンツ表示方法及びコンテンツ表示プログラム | |
JPH0728830A (ja) | オーディオデータファイルの分析処理装置 | |
JP2010057003A (ja) | 画像記録装置及び画像記録方法 | |
CN113806208A (zh) | 测试取证方法及装置、设备、存储介质 | |
KR100328366B1 (ko) | 캠코더를 이용하여 촬영한 영상신호의 편집 시스템 및편집 방법 | |
KR20140077287A (ko) | 녹음 파일 제어 단말 장치 및 방법 | |
JP3427970B2 (ja) | 擬音語による環境音付き映像編集方法および装置並びに映像編集プログラムを記録した記録媒体 | |
JP3334949B2 (ja) | 画像処理装置及びその方法 | |
JP3987561B2 (ja) | 情報ファイル装置及び情報ファイルの記録方法並びに記憶媒体 | |
JP2008017050A (ja) | 会議システム及び会議方法 | |
JP2005303840A (ja) | 動画編集装置及び動画編集方法 | |
JP2002287964A (ja) | 画面入出力仕様設計システムと方法およびプログラム | |
JPH09307851A (ja) | 画像及び音声の記録管理装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110328 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110524 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140603 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |