JP5578453B2 - 音声分類装置、方法、プログラム及び集積回路 - Google Patents
音声分類装置、方法、プログラム及び集積回路 Download PDFInfo
- Publication number
- JP5578453B2 JP5578453B2 JP2012515710A JP2012515710A JP5578453B2 JP 5578453 B2 JP5578453 B2 JP 5578453B2 JP 2012515710 A JP2012515710 A JP 2012515710A JP 2012515710 A JP2012515710 A JP 2012515710A JP 5578453 B2 JP5578453 B2 JP 5578453B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- section
- audio signal
- acoustic
- sections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 102
- 230000005236 sound signal Effects 0.000 claims description 147
- 238000000605 extraction Methods 0.000 claims description 89
- 238000004364 calculation method Methods 0.000 claims description 28
- 239000000284 extract Substances 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 29
- 238000012545 processing Methods 0.000 description 22
- 230000000875 corresponding effect Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<1.実施形態1>
<1−1.概要>
図1は本発明の実施形態1に係る映像記録装置100及びその周辺装置を示している。記録媒体110は動画のファイル群を記録しており、表示装置120は映像記録装置100から出力される映像を表示する。ここで、ファイル群は1つ以上のファイルの集まりであるとする。
<1−2.構成>
<1−2−1.全体の構成>
映像記録装置100は、ハードウェアに関しては動画のファイル群を取得する入力装置、映像を出力する出力端子、ユーザの操作を受け付ける押しボタン、データとプログラムとを記憶するメモリ及びプログラムを実行するプロセッサにより構成される。
<1−2−2.音声分類部104の構成>
以下、音声分類部104について更に詳しく説明する。
<1−3.動作>
以下では、映像記録装置100の動作について詳しく説明する。
<1−3−1.動画記録処理>
以下、図12に示す流れ図に沿って処理を説明する。
<1−3−2.音声分類処理>
以下、図13に示す流れ図に沿って、1つの動画から抽出された1つのオーディオ信号についての音声分類処理を説明する。ここでは、分類対象のオーディオ信号をオーディオ信号Aということとする。
<1−3−3.動画表示処理>
以下、図14に示す流れ図に沿って動画表示処理を説明する。
<2.実施形態2>
本発明の実施形態2として、実施形態1の映像記録装置100を、音響特徴辞書400、区間特徴辞書600及び総合特徴辞書1000を自装置内で作成するように変形した映像記録装置100aについて説明する。
<2−1.概要>
実施形態1の映像記録装置100では、基準データは予め作成されており、自装置内で作成や変更をしないこととしていた。
<2−2.構成>
映像記録装置100aの構成は図15の機能構成図に示すように、映像記録装置100に加えて基準作成部1501を備え、他は映像記録装置100と同様である。
<2−3.動作>
以下、映像記録装置100aの動作について説明する。なお、実施形態1の映像記録装置100と同じ動作の部分については説明を割愛する。
<2−3−1.動画記録処理>
動画記録処理(図12)は、以下のように変更される。
<2−3−2.基準作成処理>
基準作成処理は、基準データを作成する処理である。
<2−3−3.音響特徴辞書作成処理>
音響特徴辞書作成処理は、上述の基準作成処理の一部である。
<2−3−4.区間特徴辞書作成処理>
区間特徴辞書作成処理は、上述の基準作成処理の一部である。
<2−3−5.総合特徴辞書作成処理>
総合特徴辞書作成処理は、上述の基準作成処理の一部である。
<補足>
以上、本発明に係る音声分類装置について実施形態に基づいて説明したが、本発明は上述の実施形態で示した通りの音声分類装置に限られないことはもちろんである。
103 音声抽出部
104 音声分類部
105 分類情報記憶部
201 音響特徴抽出部
202 基準音響特徴記憶部
203 区間特徴抽出部
204 基準区間特徴記憶部
205 区間類似度計算部
206 総合特徴抽出部
207 基準総合特徴記憶部
208 分類部
1501 基準作成部
1601 基準音声記憶部
1602 基準音響特徴作成部
1603 基準区間特徴作成部
1604 基準総合特徴作成部
Claims (13)
- オーディオ信号を取得する取得手段と、
前記オーディオ信号が含む所定時間長の複数の区間それぞれについて音の周波数分布に係る特徴である区間特徴を抽出する区間特徴抽出手段と、
前記区間特徴と比較される基準である基準区間特徴を複数記憶している基準区間特徴記憶手段と、
前記複数の区間それぞれについて、前記区間特徴と前記基準区間特徴それぞれとを比較して、当該区間特徴と当該基準区間特徴との相関の程度を示す区間類似度を計算する計算手段と、
前記オーディオ信号について、前記複数の区間それぞれにおいて計算された複数の区間類似度に基づく、複数の区間に係る特徴である総合特徴を抽出する総合特徴抽出手段と、
前記総合特徴と比較する基準である基準総合特徴を1以上記憶している基準総合特徴記憶手段と、
前記オーディオ信号の総合特徴と前記基準総合特徴とを比較して、その結果に基づいて当該オーディオ信号を分類する分類手段とを備える
ことを特徴とする音声分類装置。 - 前記総合特徴抽出手段は前記オーディオ信号について、
基準区間特徴毎に、当該オーディオ信号に当該基準区間特徴との区間類似度が他の全ての基準区間特徴との区間類似度より高い区間がどの程度含まれるかを示す含有度を計算し、
各基準区間特徴の当該オーディオ信号における前記含有度により成る総合特徴を抽出する
ことを特徴とする請求項1に記載の音声分類装置。 - 前記総合特徴抽出手段は各基準区間特徴の前記オーディオ信号における前記含有度を、
当該基準区間特徴との区間類似度が他の全ての基準区間特徴との区間類似度より高い区間の総数の、当該オーディオ信号が含む区間の総数に対する割合に基づいて計算する
ことを特徴とする請求項2に記載の音声分類装置。 - 前記基準区間特徴記憶手段は更に、
各基準区間特徴に対する、当該基準区間特徴の前記含有度の計算に用いる係数を記憶しており、
前記総合特徴抽出手段は基準区間特徴の前記含有度を、
前記割合と前記係数との積として計算する
ことを特徴とする請求項3に記載の音声分類装置。 - 前記区間特徴抽出手段は、
前記複数の区間それぞれについて、当該区間に含まれる音のMFCC(メル周波数ケプストラム係数)を示す音響特徴を抽出する音響特徴抽出部と、
前記音響特徴と比較される基準である基準音響特徴を複数記憶している基準音響特徴記憶部とを備え、
前記区間特徴は、前記区間それぞれについて計算される音響特徴と、前記基準音響特徴記憶部が記憶している基準音響特徴それぞれとの相関の程度を示す音響類似度からなるデータであり、
前記区間特徴抽出手段は、
前記複数の区間それぞれについて、前記音響特徴抽出部が抽出した音響特徴と前記基準音響特徴記憶部が記憶している基準音響特徴とに基づいて、当該区間の区間特徴を抽出する
ことを特徴とする請求項2に記載の音声分類装置。 - 前記区間特徴抽出手段は、
前記複数の区間それぞれについて、当該区間に含まれる音の周波数スペクトルを示す音響特徴を抽出する音響特徴抽出部と、
前記音響特徴と比較される基準である基準音響特徴を複数記憶している基準音響特徴記憶部とを備え、
前記区間特徴は、前記区間それぞれについて計算される音響特徴と、前記基準音響特徴記憶部が記憶している基準音響特徴それぞれとの相関の程度を示す音響類似度からなるデータであり、
前記区間特徴抽出手段は、
前記複数の区間それぞれについて、前記音響特徴抽出部が抽出した音響特徴と前記基準音響特徴記憶部が記憶している基準音響特徴とに基づいて、当該区間の区間特徴を抽出する
ことを特徴とする請求項2に記載の音声分類装置。 - 前記基準総合特徴記憶手段は、
基準総合特徴を、オーディオ信号の分類先であるカテゴリと対応付けて複数記憶しており、
前記分類手段は、
前記オーディオ信号の総合特徴と、複数の互いに異なる前記基準総合特徴とを比較して、当該総合特徴と当該基準総合特徴との相関の程度を示す総合類似度を前記基準総合特徴それぞれについて求め、当該総合特徴と最も総合類似度の高い基準総合特徴に対応するカテゴリに分類する
ことを特徴とする請求項5に記載の音声分類装置。 - 前記音声分類装置は更に、
複数のオーディオ信号を記憶する音声記憶手段と、
前記音声記憶手段が記憶している各オーディオ信号から抽出された総合特徴に基づいて基準総合特徴を作成し、前記基準総合特徴記憶手段に格納する作成手段とを備える
ことを特徴とする請求項5に記載の音声分類装置。 - 前記音声分類装置は更に、
前記音声記憶手段が記憶している各オーディオ信号が含む各区間から抽出された区間特徴に基づいて基準区間特徴を作成し、前記基準区間特徴記憶手段に格納する基準区間特徴作成手段を備える
ことを特徴とする請求項8に記載の音声分類装置。 - オーディオ信号を取得する取得ステップと、
前記オーディオ信号が含む所定時間長の複数の区間それぞれについて音の周波数分布に係る特徴である区間特徴を抽出する区間特徴抽出ステップと、
前記複数の区間それぞれについて、前記区間特徴と、前記区間特徴と比較される基準である複数の基準区間特徴それぞれとを比較して、当該区間特徴と当該基準区間特徴との相関の程度を示す区間類似度を計算する計算ステップと、
前記オーディオ信号について、前記複数の区間それぞれにおいて計算された複数の区間類似度に基づく、複数の区間に係る特徴である総合特徴を抽出する総合特徴抽出ステップと、
前記オーディオ信号の総合特徴と、前記総合特徴と比較する基準である1以上の基準総合特徴とを比較して、その結果に基づいて、当該オーディオ信号を分類する分類ステップとを備える
ことを特徴とする音声分類方法。 - オーディオ信号を取得する取得ステップと、
前記オーディオ信号が含む所定時間長の複数の区間それぞれについて音の周波数分布に係る特徴である区間特徴を抽出する区間特徴抽出ステップと、
前記複数の区間それぞれについて、前記区間特徴と、前記区間特徴と比較される基準である複数の基準区間特徴それぞれとを比較して、当該区間特徴と当該基準区間特徴との相関の程度を示す区間類似度を計算する計算ステップと、
前記オーディオ信号について、前記複数の区間それぞれにおいて計算された複数の区間類似度に基づく、複数の区間に係る特徴である総合特徴を抽出する総合特徴抽出ステップと、
前記オーディオ信号の総合特徴と、前記総合特徴と比較する基準である1以上の基準総合特徴とを比較して、その結果に基づいて、当該オーディオ信号を分類する分類ステップとを含む処理をコンピュータに実行させる
ことを特徴とする音声分類プログラム。 - オーディオ信号を取得する取得ステップと、
前記オーディオ信号が含む所定時間長の複数の区間それぞれについて音の周波数分布に係る特徴である区間特徴を抽出する区間特徴抽出ステップと、
前記複数の区間それぞれについて、前記区間特徴と、前記区間特徴と比較される基準である複数の基準区間特徴それぞれとを比較して、当該区間特徴と当該基準区間特徴との相関の程度を示す区間類似度を計算する計算ステップと、
前記オーディオ信号について、前記複数の区間それぞれにおいて計算された複数の区間類似度に基づく、複数の区間に係る特徴である総合特徴を抽出する総合特徴抽出ステップと、
前記オーディオ信号の総合特徴と、前記総合特徴と比較する基準である1以上の基準総合特徴とを比較して、その結果に基づいて、当該オーディオ信号を分類する分類ステップとを含む処理をコンピュータに実行させるプログラムを記録している
ことを特徴とする記録媒体。 - オーディオ信号を取得する取得手段と、
前記オーディオ信号が含む所定時間長の複数の区間それぞれについて音の周波数分布に係る特徴である区間特徴を抽出する区間特徴抽出手段と、
前記区間特徴と比較される基準である基準区間特徴を複数記憶している基準区間特徴記憶手段と、
前記複数の区間それぞれについて、前記区間特徴と前記基準区間特徴それぞれとを比較して、当該区間特徴と当該基準区間特徴との相関の程度を示す区間類似度を計算する計算手段と、
前記オーディオ信号について、前記複数の区間それぞれにおいて計算された複数の区間類似度に基づく、複数の区間に係る特徴である総合特徴を抽出する総合特徴抽出手段と、
前記総合特徴と比較する基準である基準総合特徴を1以上記憶している基準総合特徴記憶手段と、
前記オーディオ信号の総合特徴と前記基準総合特徴とを比較して、その結果に基づいて、当該オーディオ信号を分類する分類手段とを備える
ことを特徴とする集積回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012515710A JP5578453B2 (ja) | 2010-05-17 | 2011-03-15 | 音声分類装置、方法、プログラム及び集積回路 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010112936 | 2010-05-17 | ||
JP2010112936 | 2010-05-17 | ||
JP2012515710A JP5578453B2 (ja) | 2010-05-17 | 2011-03-15 | 音声分類装置、方法、プログラム及び集積回路 |
PCT/JP2011/001484 WO2011145249A1 (ja) | 2010-05-17 | 2011-03-15 | 音声分類装置、方法、プログラム及び集積回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011145249A1 JPWO2011145249A1 (ja) | 2013-07-22 |
JP5578453B2 true JP5578453B2 (ja) | 2014-08-27 |
Family
ID=44991372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012515710A Active JP5578453B2 (ja) | 2010-05-17 | 2011-03-15 | 音声分類装置、方法、プログラム及び集積回路 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8892497B2 (ja) |
EP (1) | EP2573763B1 (ja) |
JP (1) | JP5578453B2 (ja) |
CN (1) | CN102473411B (ja) |
WO (1) | WO2011145249A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013157190A1 (ja) * | 2012-04-20 | 2013-10-24 | パナソニック株式会社 | 音声処理装置、音声処理方法、プログラムおよび集積回路 |
JP6211802B2 (ja) * | 2013-05-29 | 2017-10-11 | 日本電産サンキョー株式会社 | データ処理装置およびデータ処理方法 |
US20150066925A1 (en) * | 2013-08-27 | 2015-03-05 | Qualcomm Incorporated | Method and Apparatus for Classifying Data Items Based on Sound Tags |
KR101470904B1 (ko) | 2013-11-20 | 2014-12-09 | 김유식 | 동영상 제공 방법 및 동영상 제공 시스템 |
JP6413653B2 (ja) * | 2014-11-04 | 2018-10-31 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
US10129314B2 (en) * | 2015-08-18 | 2018-11-13 | Pandora Media, Inc. | Media feature determination for internet-based media streaming |
JP7000757B2 (ja) * | 2017-09-13 | 2022-01-19 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
JP6683231B2 (ja) * | 2018-10-04 | 2020-04-15 | ソニー株式会社 | 情報処理装置および情報処理方法 |
US11875823B2 (en) * | 2020-04-06 | 2024-01-16 | Honeywell International Inc. | Hypermedia enabled procedures for industrial workflows on a voice driven platform |
DE102020209048A1 (de) * | 2020-07-20 | 2022-01-20 | Sivantos Pte. Ltd. | Verfahren zur Identifikation eines Störeffekts sowie ein Hörsystem |
KR102586075B1 (ko) * | 2020-10-06 | 2023-10-05 | 주식회사 카카오뱅크 | 음성을 이용한 안면 검출 방법 |
CN112185418B (zh) * | 2020-11-12 | 2022-05-17 | 度小满科技(北京)有限公司 | 音频处理方法和装置 |
US20230395064A1 (en) * | 2022-06-07 | 2023-12-07 | Microsoft Technology Licensing, Llc | Application software and services with register classification capabilities |
CN115993503B (zh) * | 2023-03-22 | 2023-06-06 | 广东电网有限责任公司东莞供电局 | 一种变压器的运行检测方法、装置、设备及存储介质 |
CN117275519B (zh) * | 2023-11-22 | 2024-02-13 | 珠海高凌信息科技股份有限公司 | 一种声音类型识别修正方法、***、装置及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187182A (ja) * | 1996-12-20 | 1998-07-14 | Nippon Telegr & Teleph Corp <Ntt> | 映像分類方法および装置 |
JP2004258659A (ja) * | 2003-02-25 | 2004-09-16 | Mitsubishi Electric Research Laboratories Inc | スポーツイベントのオーディオ信号からハイライトを抽出する方法およびシステム |
JP2005530214A (ja) * | 2002-06-19 | 2005-10-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | メガ話者識別(id)システム及びその目的に相当する方法 |
JP2006276854A (ja) * | 2005-03-18 | 2006-10-12 | Sony Deutsche Gmbh | オーディオデータ分類方法 |
JP2009508156A (ja) * | 2005-09-08 | 2009-02-26 | ユニバーシティー オブ イースト アングリア | 音楽分析 |
JP2009511980A (ja) * | 2005-10-17 | 2009-03-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ入力信号についての特徴のセットを導出する方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7472059B2 (en) | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US8478587B2 (en) * | 2007-03-16 | 2013-07-02 | Panasonic Corporation | Voice analysis device, voice analysis method, voice analysis program, and system integration circuit |
-
2011
- 2011-03-15 CN CN201180002867.5A patent/CN102473411B/zh active Active
- 2011-03-15 WO PCT/JP2011/001484 patent/WO2011145249A1/ja active Application Filing
- 2011-03-15 EP EP11783188.3A patent/EP2573763B1/en active Active
- 2011-03-15 JP JP2012515710A patent/JP5578453B2/ja active Active
- 2011-03-15 US US13/382,362 patent/US8892497B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187182A (ja) * | 1996-12-20 | 1998-07-14 | Nippon Telegr & Teleph Corp <Ntt> | 映像分類方法および装置 |
JP2005530214A (ja) * | 2002-06-19 | 2005-10-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | メガ話者識別(id)システム及びその目的に相当する方法 |
JP2004258659A (ja) * | 2003-02-25 | 2004-09-16 | Mitsubishi Electric Research Laboratories Inc | スポーツイベントのオーディオ信号からハイライトを抽出する方法およびシステム |
JP2006276854A (ja) * | 2005-03-18 | 2006-10-12 | Sony Deutsche Gmbh | オーディオデータ分類方法 |
JP2009508156A (ja) * | 2005-09-08 | 2009-02-26 | ユニバーシティー オブ イースト アングリア | 音楽分析 |
JP2009511980A (ja) * | 2005-10-17 | 2009-03-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ入力信号についての特徴のセットを導出する方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2011145249A1 (ja) | 2011-11-24 |
EP2573763A4 (en) | 2016-09-21 |
EP2573763A1 (en) | 2013-03-27 |
CN102473411B (zh) | 2014-11-05 |
CN102473411A (zh) | 2012-05-23 |
JPWO2011145249A1 (ja) | 2013-07-22 |
US8892497B2 (en) | 2014-11-18 |
EP2573763B1 (en) | 2018-06-20 |
US20120136823A1 (en) | 2012-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5578453B2 (ja) | 音声分類装置、方法、プログラム及び集積回路 | |
JP2019216408A (ja) | 情報を出力するための方法、及び装置 | |
CN111526242B (zh) | 音频处理方法、装置和电子设备 | |
TWI222623B (en) | System and method for music identification | |
CN101202864B (zh) | 动画再现装置 | |
CN110249387A (zh) | 用于创建伴随视觉影像的音频轨的方法 | |
JP2006244002A (ja) | コンテンツ再生装置およびコンテンツ再生方法 | |
US11803589B2 (en) | Systems, methods, and media for identifying content | |
CN104703043A (zh) | 一种添加视频特效的方法和装置 | |
TW200402654A (en) | A system and method for providing user control over repeating objects embedded in a stream | |
CN103534755B (zh) | 声音处理装置、声音处理方法、程序及集成电路 | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
WO2023029984A1 (zh) | 视频生成方法、装置、终端、服务器及存储介质 | |
TWI807428B (zh) | 一同管理與語音檔有關的文本轉換記錄和備忘錄的方法、系統及電腦可讀記錄介質 | |
KR20090026942A (ko) | 메타데이터를 자동적으로 생성/갱신하는 멀티미디어 데이터기록 방법 및 장치 | |
JP5658285B2 (ja) | 興味区間抽出装置、興味区間抽出方法 | |
JP2004265376A (ja) | メモリに格納されたデータベースから録音物を選択する方法及び装置 | |
US11899716B2 (en) | Content providing server, content providing terminal, and content providing method | |
JP2014199490A (ja) | コンテンツ取得装置およびプログラム | |
CN110992984B (zh) | 音频处理方法及装置、存储介质 | |
KR20120111855A (ko) | 사용자 정보에 따른 스토리 생성 장치 및 방법 | |
CN112487236A (zh) | 确定关联歌单的方法、装置、设备及存储介质 | |
US20110077756A1 (en) | Method for identifying and playing back an audio recording | |
US11989231B2 (en) | Audio recommendation based on text information and video content | |
CN112040329B (zh) | 动态处理并播放多媒体内容的方法及多媒体播放装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140603 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5578453 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |