JP4870087B2 - ビデオの分類方法およびビデオの分類システム - Google Patents
ビデオの分類方法およびビデオの分類システム Download PDFInfo
- Publication number
- JP4870087B2 JP4870087B2 JP2007542936A JP2007542936A JP4870087B2 JP 4870087 B2 JP4870087 B2 JP 4870087B2 JP 2007542936 A JP2007542936 A JP 2007542936A JP 2007542936 A JP2007542936 A JP 2007542936A JP 4870087 B2 JP4870087 B2 JP 4870087B2
- Authority
- JP
- Japan
- Prior art keywords
- classes
- important
- video
- subset
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000012549 training Methods 0.000 claims description 41
- 239000000203 mixture Substances 0.000 claims description 18
- 238000002790 cross-validation Methods 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/06—Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
本発明は、包括的にはビデオセグメントの分類に関し、特に、オーディオ信号によるビデオセグメントの分類に関する。
スクリプト付き又はスクリプトなしのビデオコンテンツの分割は、ビデオの検索用途及びブラウジング用途における重要なタスクである。ビデオは、ハイライトを特定することによって分割することができる。ハイライトは、重要なすなわち注目すべき事象を含むビデオの任意の部分である。ハイライトはビデオの本質的要素を捉えるため、ハイライトセグメントは、ビデオの優れた要約となり得る。例えば、スポーツイベントのビデオにおいて、要約は、得点事象及び興奮させるプレーを含むであろう。
本発明の実施の形態は、スクリプトなしのビデオのオーディオ信号をラベルとして分類する方法を提供する。ラベルはその後、ビデオ中のハイライトを検出するため、及びハイライトセグメントのみの要約ビデオを作成するために用いることができる。
図3は、本発明の一実施形態による、ビデオ303のオーディオ信号301を特定のタスク350についてラベル321として分類する(400)方法を示す。ラベル321はその後、ビデオのハイライトを特定するために用いることができる。ハイライトは分割して(340)、ハイライトのみを含むビデオの要約304を生成することができる。
本発明の実施形態は、タスク特有の2値分類器を用いたビデオ中のハイライト検出を提供する。これらのタスク特有の2値分類器は、より少ない数のクラス、すなわち2つのクラス部分集合を区別するように設計される。この簡略化は、交差検定及びテスト誤差に基づくトレーニングとともに、クラスモデルについて、より少ない数の混合成分の使用をもたらし得る。混合成分の数が少なくなるほど、処理の速度及び精度は高くなる。
Claims (13)
- ビデオのオーディオ信号を分類するためのクラスの集合を定義するステップと、
前記集合の選択されたクラスを重要なクラスの部分集合として結合するステップであって、該重要なクラスの部分集合は特定のハイライトタスクにとって重要である、ステップと、
前記集合の残りのクラスをその他のクラスの部分集合として結合するステップと、
前記重要なクラスの部分集合と、前記その他のクラスの部分集合とを、トレーニング用のオーディオデータを用いて統合的にトレーニングして、それによって、タスク特有の分類器を形成するステップと、
前記タスク特有の分類器を用いて前記オーディオ信号を、重要なもの又はその他のものとして分類して、それによって、前記特定のハイライトタスクに対応する前記ビデオ中のハイライトを特定するステップと
を含む、ビデオの分類方法。 - 前記ビデオを前記分類されたオーディオ信号に従って、重要なセグメントとその他のセグメントとに分割すること、及び
前記重要なセグメントを結合して前記ビデオの要約にすること
をさらに含む、請求項1に記載のビデオの分類方法。 - 前記オーディオ信号をフレームに区分化すること、
各フレームからオーディオ特徴を抽出すること、及び
各フレームを前記オーディオ特徴に従って、重要なフレーム又はその他のフレームとして分類すること
をさらに含む、請求項1に記載のビデオの分類方法。 - 前記オーディオ特徴は変形離散コサイン変換である、請求項3に記載のビデオの分類方法。
- 前記ビデオはスポーツイベントのものであり、前記特定のハイライトタスクは、前記ビデオ中のハイライトを特定することであり、前記クラスの集合は、興奮した音声と歓声との混合、拍手クラス、歓声クラス、通常の音声クラス、及び音楽クラスを含み、前記重要なクラスの部分集合は、前記興奮した音声と歓声との混合を含み、前記その他のクラスの部分集合は、拍手、歓声、通常の音声、及び音楽を含む、請求項1に記載のビデオの分類方法。
- 前記重要なクラスの部分集合を第1のガウス混合モデルにより表現すること、及び
前記その他のクラスの部分集合を第2のガウス混合モデルにより表現すること
をさらに含む、請求項1に記載のビデオの分類方法。 - 前記トレーニングは、K分割交差検定を統合的に用いる、請求項1に記載のビデオの分類方法。
- 前記トレーニングは、分類の推定値を統合的に最適化する、請求項1に記載のビデオの分類方法。
- 前記分類はラベルを割り当て、前記方法は、
前記特定のハイライトタスクに従って前記ラベルの重要度レベルを求めること
をさらに含む、請求項1に記載のビデオの分類方法。 - ビデオのオーディオ信号を分類するためのクラスの集合を記憶するように構成されるメモリと、
前記集合の選択されたクラスを重要なクラスの部分集合として結合する手段であって、該重要なクラスの部分集合は特定のハイライトタスクにとって重要である、結合する手段と、
前記集合の残りのクラスをその他のクラスの部分集合として結合する手段と、
前記重要なクラスの部分集合と、前記その他のクラスの部分集合とを、トレーニング用のオーディオデータを用いて統合的にトレーニングして、それによって、タスク特有の分類器を形成する手段と、
前記タスク特有の分類器を用いて前記オーディオ信号を、重要なもの又はその他のものとして分類して、それによって、前記特定のハイライトタスクに対応する前記ビデオ中のハイライトを特定する手段と
を備える、ビデオの分類システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/326,818 | 2006-01-06 | ||
US11/326,818 US7558809B2 (en) | 2006-01-06 | 2006-01-06 | Task specific audio classification for identifying video highlights |
PCT/JP2006/326379 WO2007077965A1 (en) | 2006-01-06 | 2006-12-27 | Method and system for classifying a video |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009522587A JP2009522587A (ja) | 2009-06-11 |
JP4870087B2 true JP4870087B2 (ja) | 2012-02-08 |
Family
ID=38228305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007542936A Active JP4870087B2 (ja) | 2006-01-06 | 2006-12-27 | ビデオの分類方法およびビデオの分類システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7558809B2 (ja) |
EP (1) | EP1917660B1 (ja) |
JP (1) | JP4870087B2 (ja) |
KR (1) | KR100952804B1 (ja) |
CN (1) | CN101268505B (ja) |
WO (1) | WO2007077965A1 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630950B2 (en) * | 2006-08-18 | 2009-12-08 | International Business Machines Corporation | System and method for learning models from scarce and skewed training data |
US20080215318A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Event recognition |
CN101588450B (zh) * | 2008-05-19 | 2013-08-14 | 株式会社日立制作所 | 记录再现装置及方法 |
WO2010140355A1 (ja) * | 2009-06-04 | 2010-12-09 | パナソニック株式会社 | 音響信号処理装置および方法 |
JP2011013383A (ja) * | 2009-06-30 | 2011-01-20 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
CN101938455A (zh) * | 2009-06-30 | 2011-01-05 | 中兴通讯股份有限公司 | 音频数据传输方法与装置 |
KR101615262B1 (ko) | 2009-08-12 | 2016-04-26 | 삼성전자주식회사 | 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치 |
US8532863B2 (en) * | 2009-09-28 | 2013-09-10 | Sri International | Audio based robot control and navigation |
US8432965B2 (en) * | 2010-05-25 | 2013-04-30 | Intellectual Ventures Fund 83 Llc | Efficient method for assembling key video snippets to form a video summary |
US8923607B1 (en) * | 2010-12-08 | 2014-12-30 | Google Inc. | Learning sports highlights using event detection |
CA2891413C (en) * | 2012-11-13 | 2019-04-02 | Samsung Electronics Co., Ltd. | Method and apparatus for determining encoding mode |
AU2014262533A1 (en) | 2013-05-10 | 2015-11-26 | Uberfan, Llc | Event-related media management system |
JP2015037212A (ja) * | 2013-08-12 | 2015-02-23 | オリンパスイメージング株式会社 | 情報処理装置、撮影機器及び情報処理方法 |
US10297287B2 (en) | 2013-10-21 | 2019-05-21 | Thuuz, Inc. | Dynamic media recording |
CN104679779B (zh) | 2013-11-29 | 2019-02-01 | 华为技术有限公司 | 视频分类的方法和装置 |
US10419830B2 (en) | 2014-10-09 | 2019-09-17 | Thuuz, Inc. | Generating a customized highlight sequence depicting an event |
US11863848B1 (en) | 2014-10-09 | 2024-01-02 | Stats Llc | User interface for interaction with customized highlight shows |
US10433030B2 (en) | 2014-10-09 | 2019-10-01 | Thuuz, Inc. | Generating a customized highlight sequence depicting multiple events |
US10536758B2 (en) | 2014-10-09 | 2020-01-14 | Thuuz, Inc. | Customized generation of highlight show with narrative component |
WO2016098430A1 (ja) * | 2014-12-15 | 2016-06-23 | ソニー株式会社 | 情報処理方法、映像処理装置及びプログラム |
CN104581380B (zh) * | 2014-12-30 | 2018-08-31 | 联想(北京)有限公司 | 一种信息处理的方法及移动终端 |
CN105992061B (zh) * | 2015-02-13 | 2018-08-03 | 上海交通大学 | 一种自适应动态的多媒体分级传送播放管理方法 |
US10381022B1 (en) | 2015-12-23 | 2019-08-13 | Google Llc | Audio classifier |
JP7033587B2 (ja) * | 2016-06-20 | 2022-03-10 | ピクセルロット エルティーディー. | 映像ハイライトを自動的に製作する方法及びシステム |
CN107277617A (zh) * | 2017-07-26 | 2017-10-20 | 深圳Tcl新技术有限公司 | 预览视频的生成方法、电视机和计算机可读存储介质 |
CN108307250B (zh) | 2018-01-23 | 2020-10-30 | 浙江大华技术股份有限公司 | 一种生成视频摘要的方法及装置 |
US11594028B2 (en) | 2018-05-18 | 2023-02-28 | Stats Llc | Video processing for enabling sports highlights generation |
US11264048B1 (en) | 2018-06-05 | 2022-03-01 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
US11025985B2 (en) | 2018-06-05 | 2021-06-01 | Stats Llc | Audio processing for detecting occurrences of crowd noise in sporting event television programming |
US20200037022A1 (en) * | 2018-07-30 | 2020-01-30 | Thuuz, Inc. | Audio processing for extraction of variable length disjoint segments from audiovisual content |
CN109089127B (zh) * | 2018-07-10 | 2021-05-28 | 武汉斗鱼网络科技有限公司 | 一种视频拼接方法、装置、设备及介质 |
CN109756775B (zh) * | 2018-08-28 | 2020-04-28 | 安徽瑞羽康农业科技有限公司 | 年代类型吻合度辨识方法 |
CN109344287A (zh) * | 2018-09-05 | 2019-02-15 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法及相关设备 |
CN109446990B (zh) * | 2018-10-30 | 2020-02-28 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109376268A (zh) * | 2018-11-27 | 2019-02-22 | 北京微播视界科技有限公司 | 视频分类方法、装置、电子设备及计算机可读存储介质 |
CN111261174B (zh) * | 2018-11-30 | 2023-02-17 | 杭州海康威视数字技术股份有限公司 | 音频的分类方法、装置、终端及计算机可读存储介质 |
US10909174B1 (en) * | 2019-02-04 | 2021-02-02 | Amazon Technologies, Inc. | State detection of live feed |
CN113826116A (zh) * | 2019-05-15 | 2021-12-21 | 北京嘀嘀无限科技发展有限公司 | 用于多类分类的对抗性多二元神经网络 |
KR102554626B1 (ko) * | 2020-01-06 | 2023-07-13 | 한국전자통신연구원 | 점진적 학습을 위한 기계 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치 |
US11206453B2 (en) | 2020-04-14 | 2021-12-21 | International Business Machines Corporation | Cognitive broadcasting of an event |
CN113096687B (zh) * | 2021-03-30 | 2024-04-26 | 中国建设银行股份有限公司 | 音视频处理方法、装置、计算机设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3475317B2 (ja) * | 1996-12-20 | 2003-12-08 | 日本電信電話株式会社 | 映像分類方法および装置 |
US20020093531A1 (en) * | 2001-01-17 | 2002-07-18 | John Barile | Adaptive display for video conferences |
US7007001B2 (en) * | 2002-06-26 | 2006-02-28 | Microsoft Corporation | Maximizing mutual information between observations and hidden states to minimize classification errors |
US20040167767A1 (en) * | 2003-02-25 | 2004-08-26 | Ziyou Xiong | Method and system for extracting sports highlights from audio signals |
US20050154987A1 (en) * | 2004-01-14 | 2005-07-14 | Isao Otsuka | System and method for recording and reproducing multimedia |
US7302451B2 (en) * | 2004-05-07 | 2007-11-27 | Mitsubishi Electric Research Laboratories, Inc. | Feature identification of events in multimedia |
-
2006
- 2006-01-06 US US11/326,818 patent/US7558809B2/en not_active Expired - Fee Related
- 2006-12-27 EP EP06843749.0A patent/EP1917660B1/en not_active Expired - Fee Related
- 2006-12-27 KR KR20087009318A patent/KR100952804B1/ko active IP Right Grant
- 2006-12-27 WO PCT/JP2006/326379 patent/WO2007077965A1/en active Application Filing
- 2006-12-27 CN CN2006800348687A patent/CN101268505B/zh not_active Expired - Fee Related
- 2006-12-27 JP JP2007542936A patent/JP4870087B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009522587A (ja) | 2009-06-11 |
EP1917660B1 (en) | 2015-05-13 |
KR20080071554A (ko) | 2008-08-04 |
US20070162924A1 (en) | 2007-07-12 |
KR100952804B1 (ko) | 2010-04-14 |
US7558809B2 (en) | 2009-07-07 |
CN101268505A (zh) | 2008-09-17 |
WO2007077965A1 (en) | 2007-07-12 |
EP1917660A4 (en) | 2010-02-17 |
CN101268505B (zh) | 2011-08-17 |
EP1917660A1 (en) | 2008-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4870087B2 (ja) | ビデオの分類方法およびビデオの分類システム | |
US10262239B2 (en) | Video content contextual classification | |
US8938393B2 (en) | Extended videolens media engine for audio recognition | |
US7302451B2 (en) | Feature identification of events in multimedia | |
US9594959B2 (en) | Videolens media engine | |
US8737817B1 (en) | Music soundtrack recommendation engine for videos | |
US20140245463A1 (en) | System and method for accessing multimedia content | |
US20070294716A1 (en) | Method, medium, and apparatus detecting real time event in sports video | |
US20060058998A1 (en) | Indexing apparatus and indexing method | |
Chen et al. | Audio-visual synchronisation in the wild | |
JP2005173569A (ja) | オーディオ信号の分類装置及び方法 | |
US20040107103A1 (en) | Assessing consistency between facial motion and speech signals in video | |
Tsipas et al. | Efficient audio-driven multimedia indexing through similarity-based speech/music discrimination | |
JP5620474B2 (ja) | アンカーモデル適応装置、集積回路、AV(AudioVideo)デバイス、オンライン自己適応方法、およびそのプログラム | |
Sidiropoulos et al. | On the use of audio events for improving video scene segmentation | |
JP2006058874A (ja) | マルチメディア中の事象を検出する方法 | |
Karu et al. | Weakly supervised training of speaker identification models | |
JPH10187182A (ja) | 映像分類方法および装置 | |
Li et al. | Movie content analysis, indexing and skimming via multimodal information | |
Xiong | Audio-visual sports highlights extraction using coupled hidden markov models | |
Fersini et al. | Multimedia summarization in law courts: a clustering-based environment for browsing and consulting judicial folders | |
Rouvier et al. | Robust audio-based classification of video genre | |
JP5424306B2 (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
AU2005252714B2 (en) | Effective audio segmentation and classification | |
Essid et al. | Nonnegative matrix factorization for unsupervised audiovisual document structuring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4870087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |