JP2021193559A - ビデオ処理方法、装置、電子機器及び記憶媒体 - Google Patents
ビデオ処理方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2021193559A JP2021193559A JP2021093229A JP2021093229A JP2021193559A JP 2021193559 A JP2021193559 A JP 2021193559A JP 2021093229 A JP2021093229 A JP 2021093229A JP 2021093229 A JP2021093229 A JP 2021093229A JP 2021193559 A JP2021193559 A JP 2021193559A
- Authority
- JP
- Japan
- Prior art keywords
- video
- audio data
- label
- special effects
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 230000000694 effects Effects 0.000 claims abstract description 121
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 32
- 230000015654 memory Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2621—Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/083—Recognition networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4888—Data services, e.g. news ticker for displaying teletext characters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
ビデオ再生中に、所定のポリシーに従って決定された、未再生の処理待ちのオーディオデータに対して、それぞれ、
前記オーディオデータに対応するテキストコンテンツから所定の要求を満たす単語を抽出して、前記オーディオデータのラベルとするステップと、
前記ラベルに基づいて前記オーディオデータに対応する特殊効果動画を決定するステップと、
前記オーディオデータが再生し始めるとき、前記特殊効果動画を対応するビデオ画面に重畳して表示するステップと、を含む処理を行う。
前記ラベル生成モジュールは、ビデオ再生中に、所定のポリシーに従って決定された処理待ちの未再生のオーディオデータに対して、それぞれ、前記オーディオデータに対応するテキストコンテンツから所定の要求を満たす単語を抽出して、前記オーディオデータのラベルとするために用いられ、
前記動画取得モジュールは、前記ラベルに基づいて前記オーディオデータに対応する特殊効果動画を決定するために用いられ、
前記動画表示モジュールは、前記オーディオデータが再生し始めるとき、前記特殊効果動画を対応するビデオ画面に重畳して表示するために用いられる。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記に記載の方法を実行することができる。
Claims (21)
- ビデオ処理方法であって、
ビデオ再生中に、所定のポリシーに従って決定された、処理待ちの未再生のオーディオデータに対して、それぞれ、
前記オーディオデータに対応するテキストコンテンツから所定の要求を満たす単語を抽出して、前記オーディオデータのラベルとするステップと、
前記ラベルに基づいて前記オーディオデータに対応する特殊効果動画を決定するステップと、
前記オーディオデータが再生し始めるとき、前記特殊効果動画を対応するビデオ画面に重畳して表示するステップと、を含む処理を行う、
ビデオ処理方法。 - 前記オーディオデータに対応するテキストコンテンツから所定の要求を満たす単語を抽出して、前記オーディオデータのラベルとするステップは、
前記テキストコンテンツに対して単語分割処理を行うステップと、
任意の単語分割結果に対して、前記単語分割結果が予め生成されたホットワード単語リストにあると判定された場合、前記単語分割結果がホットワードであると判定し、前記単語分割結果を前記オーディオデータのラベルとするステップと、を含む、
請求項1に記載のビデオ処理方法。 - 当該方法は、前記オーディオデータを予めトレーニングされたシーン識別モデルに入力し、識別された前記オーディオデータに対応するシーンを取得して、前記シーンを前記オーディオデータのラベルとするステップをさらに含む、
請求項1または2に記載のビデオ処理方法。 - 前記シーン識別モデルは、ディープラーニング方法を使用してトレーニングされたシーン識別モデルを含む、
請求項3に記載のビデオ処理方法。 - 前記ラベルに基づいて前記オーディオデータに対応する特殊効果動画を決定するステップは、
前記ラベルの数が1である場合、前記ラベルに対応する特殊効果動画を前記オーディオデータに対応する特殊効果動画として取得するステップと、
前記ラベルの数が1より大きい場合、その中から一つのラベルを選択し、選択したラベルに対応する特殊効果動画を前記オーディオデータに対応する特殊効果動画として取得するステップと、を含む、
請求項3または4に記載のビデオ処理方法。 - 任意のラベルに対応する特殊効果動画を取得するステップは、
前記ラベルに対応する特殊効果動画がローカルに記憶されている場合、ローカルから前記ラベルに対応する特殊効果動画を取得するステップと、
前記ラベルに対応する特殊効果動画がローカルに記憶されていない場合、サーバから前記ラベルに対応する特殊効果動画を取得して、ローカルに記憶するステップと、を含む、
請求項5に記載のビデオ処理方法。 - 当該ビデオ処理方法は、
任意の特殊効果動画のローカルにおける記憶期間が第1の所定の期間を超える場合、前記特殊効果動画をローカルから削除するステップと、
及び/又は、ローカルに記憶された任意の特殊効果動画が第2の所定の期間を超えて使用されていない場合、前記特殊効果動画をローカルから削除するステップと、をさらに含む、
請求項6に記載のビデオ処理方法。 - 前記処理待ちのオーディオデータの決定方式は、
前記ビデオを所定の期間ごとにM個の連続ビデオクリップに分割するステップであって、Mは1より大きい正の整数であるステップと、
任意のビデオクリップに対応するオーディオデータに対して、それぞれ所定のポリシーに従ってその中からオーディオデータの一部を選択して、前記処理待ちのオーディオデータとするステップと、を含む、
請求項1から7のいずれか一項に記載のビデオ処理方法。 - 前記所定のポリシーに従ってその中からオーディオデータの一部を選択するステップは、語義が最も完全な一つの語句に対応するオーディオデータを選択するステップを含む、
請求項8に記載のビデオ処理方法。 - ビデオ処理装置であって、
ラベル生成モジュール、動画取得モジュール、及び動画表示モジュールを含み、
前記ラベル生成モジュールは、ビデオ再生中に、所定のポリシーに従って決定された処理待ちの未再生のオーディオデータに対して、それぞれ、前記オーディオデータに対応するテキストコンテンツから所定の要求を満たす単語を抽出して、前記オーディオデータのラベルとするために用いられ、
前記動画取得モジュールは、前記ラベルに基づいて前記オーディオデータに対応する特殊効果動画を決定するために用いられ、
前記動画表示モジュールは、前記オーディオデータが再生し始めるとき、前記特殊効果動画を対応するビデオ画面に重畳して表示するために用いられる、
ビデオ処理装置。 - 前記ラベル生成モジュールは、前記テキストコンテンツに対して単語分割処理を行い、任意の単語分割結果に対して、前記単語分割結果が予め生成されたホットワード単語リストにあると判定された場合、前記単語分割結果がホットワードであると決定し、前記単語分割結果を前記オーディオデータのラベルとする、
請求項10に記載のビデオ処理装置。 - 前記ラベル生成モジュールは、さらに、前記オーディオデータを予めトレーニングされたシーン識別モデルに入力し、識別された前記オーディオデータに対応するシーンを取得して、前記シーンを前記オーディオデータのラベルとするために用いられる、
請求項10または11に記載のビデオ処理装置。 - 前記シーン識別モデルは、ディープラーニング方法を使用してトレーニングされたシーン識別モデルを含む、
請求項12に記載のビデオ処理装置。 - 前記動画取得モジュールは、前記ラベルの数が1である場合、前記ラベルに対応する特殊効果動画を前記オーディオデータに対応する特殊効果動画として取得し、前記ラベルの数が1より大きい場合、その中から一つのラベルを選択し、選択したラベルに対応する特殊効果動画を前記オーディオデータに対応する特殊効果動画として取得する、
請求項12または13に記載のビデオ処理装置。 - 前記動画取得モジュールは、任意のラベルに対応する特殊効果動画を取得する必要がある時、前記ラベルに対応する特殊効果動画がローカルに記憶されていることが判定された場合、ローカルから前記ラベルに対応する特殊効果動画を取得し、前記ラベルに対応する特殊効果動画がローカルに記憶されていないと判定された場合、サーバから前記ラベルに対応する特殊効果動画を取得して、ローカルに記憶する、
請求項14に記載のビデオ処理装置。 - 前記動画取得モジュールは、さらに、任意の特殊効果動画のローカルにおける記憶期間が第1の所定の期間を超えると判定された場合、前記特殊効果動画をローカルから削除し、及び/又は、ローカルに記憶された任意の特殊効果動画が第2の所定の期間を超えて使用されていないと判定された場合、前記特殊効果動画をローカルから削除するために用いられる、
請求項15に記載のビデオ処理装置。 - 前記ビデオ処理装置は、オーディオ取得モジュールをさらに含み、前記オーディオ取得モジュールは、前記ビデオを所定の期間ごとに、1より大きい正の整数であるM個の連続ビデオクリップに分割するために用いられ、任意のビデオクリップに対応するオーディオデータに対して、それぞれ所定のポリシーに従ってその中からオーディオデータの一部を選択して、前記処理待ちのオーディオデータとするために用いられる、
請求項10から16のいずれか一項に記載のビデオ処理装置。 - 前記オーディオ取得モジュールは、語義が最も完全な一つの語句に対応するオーディオデータを選択する、
請求項17に記載のビデオ処理装置。 - 電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1〜9のいずれか一項に記載のビデオ処理方法を実行する、
電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項1〜9のいずれか一項に記載のビデオ処理方法を実行させる、
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。 - コンピュータに請求項1〜9のいずれか一項に記載のビデオ処理方法を実行させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010504444.4 | 2020-06-05 | ||
CN202010504444.4A CN111770375B (zh) | 2020-06-05 | 2020-06-05 | 视频处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021193559A true JP2021193559A (ja) | 2021-12-23 |
JP7263660B2 JP7263660B2 (ja) | 2023-04-25 |
Family
ID=72720366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021093229A Active JP7263660B2 (ja) | 2020-06-05 | 2021-06-02 | ビデオ処理方法、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11800042B2 (ja) |
EP (1) | EP3923283A1 (ja) |
JP (1) | JP7263660B2 (ja) |
KR (1) | KR102541051B1 (ja) |
CN (1) | CN111770375B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112995694B (zh) * | 2021-04-09 | 2022-11-22 | 北京字节跳动网络技术有限公司 | 视频显示方法、装置、电子设备及存储介质 |
CN113824899B (zh) * | 2021-09-18 | 2022-11-04 | 北京百度网讯科技有限公司 | 视频处理方法、装置、电子设备及介质 |
CN114173067B (zh) * | 2021-12-21 | 2024-07-12 | 科大讯飞股份有限公司 | 一种视频生成方法、装置、设备及存储介质 |
CN114630057B (zh) * | 2022-03-11 | 2024-01-30 | 北京字跳网络技术有限公司 | 确定特效视频的方法、装置、电子设备及存储介质 |
CN116017093B (zh) * | 2022-12-15 | 2023-08-11 | 广州迅控电子科技有限公司 | 一种视频环境模拟方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1318658A2 (en) * | 2001-12-04 | 2003-06-11 | Fuji Photo Film Co., Ltd. | Method and apparatus for registering modification pattern of transmission image and method and apparatus for reproducing the same |
JP2003244425A (ja) * | 2001-12-04 | 2003-08-29 | Fuji Photo Film Co Ltd | 伝送画像の修飾パターンの登録方法および装置ならびに再生方法および装置 |
JP2011250100A (ja) * | 2010-05-26 | 2011-12-08 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2016035607A (ja) * | 2012-12-27 | 2016-03-17 | パナソニック株式会社 | ダイジェストを生成するための装置、方法、及びプログラム |
CN109996026A (zh) * | 2019-04-23 | 2019-07-09 | 广东小天才科技有限公司 | 基于穿戴式设备的视频特效互动方法、装置、设备及介质 |
US10467792B1 (en) * | 2017-08-24 | 2019-11-05 | Amazon Technologies, Inc. | Simulating communication expressions using virtual objects |
WO2020091930A1 (en) * | 2018-10-31 | 2020-05-07 | Sony Interactive Entertainment Inc. | Textual annotation of acoustic effects |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6976028B2 (en) | 2001-06-15 | 2005-12-13 | Sony Corporation | Media content creating and publishing system and process |
US7743329B2 (en) * | 2003-06-27 | 2010-06-22 | Microsoft Corporation | Incorporating interactive media into a playlist |
CN101268494B (zh) * | 2005-09-21 | 2012-01-04 | 松下电器产业株式会社 | 视频制作装置以及视频制作方法 |
CN101546587A (zh) * | 2008-03-25 | 2009-09-30 | 国际商业机器公司 | 在播放歌曲时自动显示视觉元素的方法和装置 |
KR101070026B1 (ko) | 2009-09-03 | 2011-10-05 | 삼성전기주식회사 | 동영상 촬영 장치 및 동영상 촬영 방법 |
CN101853668B (zh) * | 2010-03-29 | 2014-10-29 | 北京中星微电子有限公司 | 一种将midi音乐生成动画的方法和*** |
JP2013042356A (ja) * | 2011-08-16 | 2013-02-28 | Sony Corp | 画像処理装置および方法、並びにプログラム |
CN104394324B (zh) * | 2014-12-09 | 2018-01-09 | 成都理想境界科技有限公司 | 特效视频生成方法及装置 |
CN104754394A (zh) * | 2015-02-01 | 2015-07-01 | 苏州乐聚一堂电子科技有限公司 | 同步视觉特效***及同步视觉特效处理方法 |
CN104703043A (zh) * | 2015-03-26 | 2015-06-10 | 努比亚技术有限公司 | 一种添加视频特效的方法和装置 |
CN104780459A (zh) * | 2015-04-16 | 2015-07-15 | 美国掌赢信息科技有限公司 | 一种即时视频中的特效加载方法和电子设备 |
TWI597980B (zh) * | 2015-08-10 | 2017-09-01 | 宏達國際電子股份有限公司 | 影音管理方法及其系統 |
US20170316807A1 (en) * | 2015-12-11 | 2017-11-02 | Squigl LLC | Systems and methods for creating whiteboard animation videos |
CN106127829B (zh) * | 2016-06-28 | 2020-06-30 | Oppo广东移动通信有限公司 | 一种增强现实的处理方法、装置及终端 |
CN106096062A (zh) * | 2016-07-15 | 2016-11-09 | 乐视控股(北京)有限公司 | 视频交互方法及装置 |
CN106446135B (zh) * | 2016-09-19 | 2019-12-10 | 北京搜狐新动力信息技术有限公司 | 一种多媒体数据标签生成方法和装置 |
CN107493442A (zh) * | 2017-07-21 | 2017-12-19 | 北京奇虎科技有限公司 | 一种编辑视频的方法和装置 |
CN107967706B (zh) * | 2017-11-27 | 2021-06-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 多媒体数据的处理方法、装置及计算机可读存储介质 |
CN108307229B (zh) * | 2018-02-02 | 2023-12-22 | 新华智云科技有限公司 | 一种影音数据的处理方法及设备 |
KR102085908B1 (ko) | 2018-05-10 | 2020-03-09 | 네이버 주식회사 | 컨텐츠 제공 서버, 컨텐츠 제공 단말 및 컨텐츠 제공 방법 |
CN108764304B (zh) * | 2018-05-11 | 2020-03-06 | Oppo广东移动通信有限公司 | 场景识别方法、装置、存储介质及电子设备 |
CN108877838B (zh) * | 2018-07-17 | 2021-04-02 | 黑盒子科技(北京)有限公司 | 音乐特效匹配方法及装置 |
CN110830852B (zh) * | 2018-08-07 | 2022-08-12 | 阿里巴巴(中国)有限公司 | 一种视频内容的处理方法及装置 |
CN109147825A (zh) * | 2018-08-09 | 2019-01-04 | 湖南永爱生物科技有限公司 | 基于语音识别的人脸表情装饰方法、装置、存储介质及电子设备 |
CN109729297A (zh) * | 2019-01-11 | 2019-05-07 | 广州酷狗计算机科技有限公司 | 在视频中添加特效的方法和装置 |
CN110008922B (zh) * | 2019-04-12 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 用于终端设备的图像处理方法、设备、装置、介质 |
-
2020
- 2020-06-05 CN CN202010504444.4A patent/CN111770375B/zh active Active
-
2021
- 2021-06-01 EP EP21177202.5A patent/EP3923283A1/en not_active Ceased
- 2021-06-02 JP JP2021093229A patent/JP7263660B2/ja active Active
- 2021-06-03 KR KR1020210072374A patent/KR102541051B1/ko active IP Right Grant
- 2021-06-03 US US17/337,920 patent/US11800042B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1318658A2 (en) * | 2001-12-04 | 2003-06-11 | Fuji Photo Film Co., Ltd. | Method and apparatus for registering modification pattern of transmission image and method and apparatus for reproducing the same |
US20030112259A1 (en) * | 2001-12-04 | 2003-06-19 | Fuji Photo Film Co., Ltd. | Method and apparatus for registering modification pattern of transmission image and method and apparatus for reproducing the same |
JP2003244425A (ja) * | 2001-12-04 | 2003-08-29 | Fuji Photo Film Co Ltd | 伝送画像の修飾パターンの登録方法および装置ならびに再生方法および装置 |
JP2011250100A (ja) * | 2010-05-26 | 2011-12-08 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2016035607A (ja) * | 2012-12-27 | 2016-03-17 | パナソニック株式会社 | ダイジェストを生成するための装置、方法、及びプログラム |
US10467792B1 (en) * | 2017-08-24 | 2019-11-05 | Amazon Technologies, Inc. | Simulating communication expressions using virtual objects |
WO2020091930A1 (en) * | 2018-10-31 | 2020-05-07 | Sony Interactive Entertainment Inc. | Textual annotation of acoustic effects |
CN109996026A (zh) * | 2019-04-23 | 2019-07-09 | 广东小天才科技有限公司 | 基于穿戴式设备的视频特效互动方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
KR102541051B1 (ko) | 2023-06-05 |
EP3923283A1 (en) | 2021-12-15 |
CN111770375A (zh) | 2020-10-13 |
US11800042B2 (en) | 2023-10-24 |
JP7263660B2 (ja) | 2023-04-25 |
CN111770375B (zh) | 2022-08-23 |
KR20210152396A (ko) | 2021-12-15 |
US20210385392A1 (en) | 2021-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021193559A (ja) | ビデオ処理方法、装置、電子機器及び記憶媒体 | |
KR20210040885A (ko) | 정보 생성 방법 및 장치 | |
US11423907B2 (en) | Virtual object image display method and apparatus, electronic device and storage medium | |
US10945040B1 (en) | Generating and providing topic visual elements based on audio content and video content of a digital video | |
US9940396B1 (en) | Mining potential user actions from a web page | |
CN115082602B (zh) | 生成数字人的方法、模型的训练方法、装置、设备和介质 | |
JP2021114287A (ja) | ビデオ検索方法、装置、デバイス及び媒体 | |
WO2019047878A1 (zh) | 语音操控终端的方法、终端、服务器和存储介质 | |
JP2022033689A (ja) | ページのテーマを決定するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
US20170109339A1 (en) | Application program activation method, user terminal, and server | |
JP2021192290A (ja) | 機械翻訳モデルのトレーニング方法、装置及び電子機器 | |
KR20210040329A (ko) | 비디오 태그의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
JP7200277B2 (ja) | ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
US20230405455A1 (en) | Method and apparatus for processing cloud gaming resource data, computer device, and storage medium | |
WO2023016349A1 (zh) | 一种文本输入方法、装置、电子设备和存储介质 | |
JP2022518645A (ja) | 映像配信時効の決定方法及び装置 | |
CN108197105B (zh) | 自然语言处理方法、装置、存储介质及电子设备 | |
KR20160022362A (ko) | 상태 정보를 위한 동기화 지점 | |
AU2020288833B2 (en) | Techniques for text rendering using font patching | |
US20220083741A1 (en) | Method for aligning text with media material, apparatus and storage medium | |
US20230298629A1 (en) | Dynamically generated content stickers for use in video creation | |
JP2022020063A (ja) | 対話処理方法、装置、電子機器及び記憶媒体 | |
CN111291205B (zh) | 知识图谱构建方法、装置、设备和介质 | |
CN111652344A (zh) | 用于呈现信息的方法和装置 | |
CN112988099A (zh) | 视频的显示方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210602 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230317 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7263660 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |