JP7355865B2 - ビデオ処理方法、装置、デバイスおよび記憶媒体 - Google Patents
ビデオ処理方法、装置、デバイスおよび記憶媒体 Download PDFInfo
- Publication number
- JP7355865B2 JP7355865B2 JP2022023611A JP2022023611A JP7355865B2 JP 7355865 B2 JP7355865 B2 JP 7355865B2 JP 2022023611 A JP2022023611 A JP 2022023611A JP 2022023611 A JP2022023611 A JP 2022023611A JP 7355865 B2 JP7355865 B2 JP 7355865B2
- Authority
- JP
- Japan
- Prior art keywords
- original
- comment
- video
- target
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 32
- 238000000034 method Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 24
- 230000002996 emotional effect Effects 0.000 claims description 16
- 238000012015 optical character recognition Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000003780 insertion Methods 0.000 claims description 5
- 230000037431 insertion Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000001815 facial effect Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000012549 training Methods 0.000 description 15
- 230000008451 emotion Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000036651 mood Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4886—Data services, e.g. news ticker for displaying a ticker, e.g. scrolling banner for news, stock exchange, weather data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4882—Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8126—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
- H04N21/8133—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
本願の他の特徴、目的および利点は、以下の図面で行われる非限定的な実施例についての詳細な説明からより明らかになるであろう。図面は、本実施例をより明確に理解するために使用されており、本願を限定するものではない。
図1中の端末装置、ネットワーク、およびサーバの数は、単なる例示であることを理解されたい。実際のニーズに応じて、端末装置、ネットワーク、およびサーバの数が任意に設定され得る。
本実施例では、上記実行主体は、テキスト情報の内容と一致するターゲットコメントを決定することができる。具体的には、ターゲットコメントごとに、このターゲットコメントの内容をピクチャのテキスト情報の内容と一致させ、比較結果に基づいて、内容が一致するか否かを決定することができる。例えば、一致度がプリセット閾値よりも高いターゲットコメントを、ピクチャのテキスト情報の内容と一致するターゲットコメントを決定する。また例えば、一致度が最も高いターゲットコメントを、テキスト情報の内容と一致するターゲットコメントを決定する。
Claims (21)
- ビデオ処理装置により実行されるビデオ処理方法であって、
ターゲットビデオおよび前記ターゲットビデオのターゲットコメントを取得することと、
前記ターゲットビデオ内のピクチャを認識して、前記ピクチャのテキスト情報を取得することと、
前記テキスト情報の内容と一致するターゲットコメントを決定することと、
前記ターゲットビデオ内の前記ピクチャの表示時刻に前記内容と一致するターゲットコメントを弾幕の形式で挿入することと、を含み、
前述したターゲットビデオを取得することは、
オリジナルニュースを取得することと、
前記オリジナルニュースに関連するオリジナルビデオを検索することと、
前記オリジナルニュースの要約抽出を実行して、前記オリジナルニュースの解説文を取得することと、
前記解説文に基づいてビデオ音声を生成し、前記オリジナルニュースおよび前記オリジナルビデオに基づいて、前記ビデオ音声に対応するビデオ画面を生成することと、
前記ビデオ画面および前記ビデオ音声を合成して、前記ターゲットビデオを取得することと、
を含む、ビデオ処理方法。 - 前述した前記オリジナルニュースに関連するオリジナルビデオを検索することは、
前記オリジナルニュースのオリジナルコメントを取得することと、
前記オリジナルニュースおよび/または前記オリジナルコメントの内容に基づいて、前記オリジナルビデオを検索することと、
を含む請求項1に記載のビデオ処理方法。 - 前述した前記ターゲットビデオのターゲットコメントを取得することは、
前記オリジナルニュースのオリジナルコメントを取得することと、
前記ターゲットビデオの内容と一致するオリジナルコメントを前記ターゲットコメントとして選択することと、
を含む請求項1に記載のビデオ処理方法。 - 前述した前記ターゲットビデオの内容と一致するオリジナルコメントを選択することは、
前記オリジナルコメントの字句解析を実行し、前記オリジナルコメントを単語に分解することと、
前記単語をアンカーポイントとして、前記オリジナルコメントを解析し、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することと、
を含む請求項3に記載のビデオ処理方法。 - 前述した前記単語をアンカーポイントとして、前記オリジナルコメントを解析し、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することは、
前記単語をアンカーポイントとして、前記オリジナルコメントの構文解析を実行し、前記オリジナルコメントのキーワードおよび文構造を取得することと、
前記キーワードおよび前記文構造に基づいて、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することと、
を含む請求項4に記載のビデオ処理方法。 - 前述した前記単語をアンカーポイントとして、前記オリジナルコメントを解析し、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することは、
前記単語をアンカーポイントとして、前記オリジナルコメントの感情解析を実行し、前記オリジナルコメントの感情情報を取得することと、
前記感情情報に基づいて、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することと、
を含む請求項4に記載のビデオ処理方法。 - 前述した前記ターゲットビデオ内のピクチャを認識して、前記ピクチャのテキスト情報を取得することは、
前記ターゲットビデオ内のピクチャに対して光学文字認識を実行して、前記ピクチャの文字情報を取得すること、
を含む請求項1に記載のビデオ処理方法。 - 前述した前記ターゲットビデオ内のピクチャを認識して、前記ピクチャのテキスト情報を取得することは、
前記ターゲットビデオ内のピクチャに対して顔認識を実行して、前記ピクチャの人物情報を取得すること、
を含む請求項1に記載のビデオ処理方法。 - 前述した前記テキスト情報の内容と一致するターゲットコメントを決定することは、
前記テキスト情報および前記ターゲットコメントを事前に訓練されたスコア計算モデルに入力して、前記テキスト情報および前記ターゲットコメントのスコアを取得することと、
前記テキスト情報および前記ターゲットコメントのスコアに基づいて、前記テキスト情報の内容が前記ターゲットコメントと一致するか否かを決定することと、
を含む請求項1に記載のビデオ処理方法。 - ターゲットビデオおよび前記ターゲットビデオのターゲットコメントを取得するように構成された取得モジュールと、
前記ターゲットビデオ内のピクチャを認識して、前記ピクチャのテキスト情報を取得するように構成された認識モジュールと、
前記テキスト情報の内容と一致するターゲットコメントを決定するように構成された決定モジュールと、
前記ターゲットビデオ内の前記ピクチャの表示時刻に前記内容と一致するターゲットコメントを弾幕の形式で挿入するように構成された挿入モジュールと、を含み、
前記取得モジュールは、
オリジナルニュースを取得するように構成された第一取得サブモジュールと、
前記オリジナルニュースに関連するオリジナルビデオを検索するように構成された検索サブモジュールと、
前記オリジナルニュースの要約抽出を実行して、前記オリジナルニュースの解説文を取得するように構成された抽出サブモジュールと、
前記解説文に基づいてビデオ音声を生成し、前記オリジナルニュースおよび前記オリジナルビデオに基づいて、前記ビデオ音声に対応するビデオ画面を生成するように構成された生成サブモジュールと、
前記ビデオ画面および前記ビデオ音声を合成して、前記ターゲットビデオを取得するように構成された合成サブモジュールと、
を含む、ビデオ処理装置。 - 前記検索サブモジュールは、
前記オリジナルニュースのオリジナルコメントを取得することと、
前記オリジナルニュースおよび/または前記オリジナルコメントの内容に基づいて、前記オリジナルビデオを検索することと、
を実行するようにさらに構成される請求項10に記載のビデオ処理装置。 - 前記取得モジュールは、
前記オリジナルニュースのオリジナルコメントを取得するように構成された第二取得サブモジュールと、
前記ターゲットビデオの内容と一致するオリジナルコメントを前記ターゲットコメントとして選択するように構成された選択サブモジュールと、
を含む請求項10に記載のビデオ処理装置。 - 前記選択サブモジュールは、
前記オリジナルコメントの字句解析を実行し、前記オリジナルコメントを単語に分解するように構成された分解ユニットと、
前記単語をアンカーポイントとして、前記オリジナルコメントを解析し、前記ターゲットビデオの内容と一致するオリジナルコメントを選択するように構成された選択ユニットと、
を含む請求項12に記載のビデオ処理装置。 - 前記選択ユニットは、
前記単語をアンカーポイントとして、前記オリジナルコメントの構文解析を実行し、前記オリジナルコメントのキーワードおよび文構造を取得することと、
前記キーワードおよび前記文構造に基づいて、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することと、
を実行するようにさらに構成される請求項13に記載のビデオ処理装置。 - 前記選択ユニットは、
前記単語をアンカーポイントとして、前記オリジナルコメントの感情解析を実行し、前記オリジナルコメントの感情情報を取得することと、
前記感情情報に基づいて、前記ターゲットビデオの内容と一致するオリジナルコメントを選択することと、
を実行するようにさらに構成される請求項13に記載のビデオ処理装置。 - 前記認識モジュールは、
前記ターゲットビデオ内のピクチャに対して光学文字認識を実行して、前記ピクチャの文字情報を取得すること、
を実行するようにさらに構成される請求項10に記載のビデオ処理装置。 - 前記認識モジュールは、
前記ターゲットビデオ内のピクチャに対して顔認識を実行して、前記ピクチャの人物情報を取得すること、
を実行するようにさらに構成される請求項10に記載のビデオ処理装置。 - 前記決定モジュールは、
前記テキスト情報および前記ターゲットコメントを事前に訓練されたスコア計算モデルに入力して、前記テキスト情報および前記ターゲットコメントのスコアを取得することと、
前記テキスト情報および前記ターゲットコメントのスコアに基づいて、前記テキスト情報の内容が前記ターゲットコメントと一致するか否かを決定することと、
を実行するようにさらに構成される請求項10に記載のビデオ処理装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが請求項1-9のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
電子デバイス。 - 請求項1-9のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータ命令を記憶する非一時的なコンピュータ可読記憶媒体。
- プロセッサによって実行されると、請求項1-9のいずれか一項に記載の方法を実行するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110200351.7 | 2021-02-23 | ||
CN202110200351.7A CN113014988B (zh) | 2021-02-23 | 2021-02-23 | 视频处理方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022075668A JP2022075668A (ja) | 2022-05-18 |
JP7355865B2 true JP7355865B2 (ja) | 2023-10-03 |
Family
ID=76407155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022023611A Active JP7355865B2 (ja) | 2021-02-23 | 2022-02-18 | ビデオ処理方法、装置、デバイスおよび記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220174369A1 (ja) |
EP (1) | EP3982276A3 (ja) |
JP (1) | JP7355865B2 (ja) |
CN (1) | CN113014988B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113613065B (zh) * | 2021-08-02 | 2022-09-09 | 北京百度网讯科技有限公司 | 视频编辑方法、装置、电子设备以及存储介质 |
CN113673414B (zh) * | 2021-08-18 | 2023-09-01 | 北京奇艺世纪科技有限公司 | 弹幕生成方法、装置、电子设备及存储介质 |
CN113742501A (zh) * | 2021-08-31 | 2021-12-03 | 北京百度网讯科技有限公司 | 一种信息提取方法、装置、设备、及介质 |
CN114584841A (zh) * | 2022-03-02 | 2022-06-03 | 湖南快乐阳光互动娱乐传媒有限公司 | 评论内容生成方法及装置、存储介质及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155384A (ja) | 2004-11-30 | 2006-06-15 | Nippon Telegr & Teleph Corp <Ntt> | 映像コメント入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2006352779A (ja) | 2005-06-20 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | 映像情報入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2011151741A (ja) | 2010-01-25 | 2011-08-04 | Nippon Hoso Kyokai <Nhk> | 選択肢生成提示装置及び選択肢生成提示プログラム |
WO2016088566A1 (ja) | 2014-12-03 | 2016-06-09 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US20160301650A1 (en) | 2013-02-08 | 2016-10-13 | Google Inc. | Methods, systems, and media for presenting comments based on correlation with content |
JP2018525745A (ja) | 2016-02-01 | 2018-09-06 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 情報をプッシュ配信する方法及び装置 |
JP2019161465A (ja) | 2018-03-13 | 2019-09-19 | 株式会社東芝 | 情報処理システム、情報処理方法およびプログラム |
CN111327960A (zh) | 2020-03-05 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 文章处理方法、装置、电子设备及计算机存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559214B (zh) * | 2013-10-11 | 2017-02-08 | 中国农业大学 | 视频自动生成方法及装置 |
CN104618806A (zh) * | 2014-03-17 | 2015-05-13 | 腾讯科技(北京)有限公司 | 获取视频的评论信息的方法、装置及*** |
US20150382077A1 (en) * | 2014-06-26 | 2015-12-31 | Xiaomi Inc. | Method and terminal device for acquiring information |
CN108124167A (zh) * | 2016-11-30 | 2018-06-05 | 阿里巴巴集团控股有限公司 | 一种播放处理方法、装置和设备 |
US10678851B2 (en) * | 2018-04-25 | 2020-06-09 | International Business Machines Corporation | Cognitive content display device |
CN109618236B (zh) * | 2018-12-13 | 2023-04-07 | 连尚(新昌)网络科技有限公司 | 视频评论处理方法和装置 |
CN114666663A (zh) * | 2019-04-08 | 2022-06-24 | 百度(美国)有限责任公司 | 用于生成视频的方法和装置 |
CN111954052B (zh) * | 2019-05-17 | 2022-04-05 | 上海哔哩哔哩科技有限公司 | 显示弹幕信息的方法、计算机设备及可读存储介质 |
CN110267113B (zh) * | 2019-06-14 | 2021-10-15 | 北京字节跳动网络技术有限公司 | 视频文件加工方法、***、介质和电子设备 |
CN110366002B (zh) * | 2019-06-14 | 2022-03-11 | 北京字节跳动网络技术有限公司 | 视频文件合成方法、***、介质和电子设备 |
CN110377842A (zh) * | 2019-06-14 | 2019-10-25 | 北京字节跳动网络技术有限公司 | 语音评论显示方法、***、介质和电子设备 |
CN110740387B (zh) * | 2019-10-30 | 2021-11-23 | 深圳Tcl数字技术有限公司 | 一种弹幕编辑方法、智能终端及存储介质 |
US20210185386A1 (en) * | 2019-12-17 | 2021-06-17 | Tencent Technology (Shenzhen) Company Limited | Video playing method and apparatus, electronic device, and storage medium |
CN111294663B (zh) * | 2020-02-10 | 2022-01-07 | 腾讯科技(深圳)有限公司 | 弹幕处理方法、装置、电子设备及计算机可读存储介质 |
CN111711865A (zh) * | 2020-06-30 | 2020-09-25 | 浙江同花顺智能科技有限公司 | 输出数据的方法、设备及存储介质 |
CN113905125B (zh) * | 2021-09-08 | 2023-02-21 | 维沃移动通信有限公司 | 视频显示方法、装置、电子设备及存储介质 |
-
2021
- 2021-02-23 CN CN202110200351.7A patent/CN113014988B/zh active Active
-
2022
- 2022-02-17 EP EP22157251.4A patent/EP3982276A3/en active Pending
- 2022-02-18 JP JP2022023611A patent/JP7355865B2/ja active Active
- 2022-02-18 US US17/651,714 patent/US20220174369A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006155384A (ja) | 2004-11-30 | 2006-06-15 | Nippon Telegr & Teleph Corp <Ntt> | 映像コメント入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2006352779A (ja) | 2005-06-20 | 2006-12-28 | Nippon Telegr & Teleph Corp <Ntt> | 映像情報入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2011151741A (ja) | 2010-01-25 | 2011-08-04 | Nippon Hoso Kyokai <Nhk> | 選択肢生成提示装置及び選択肢生成提示プログラム |
US20160301650A1 (en) | 2013-02-08 | 2016-10-13 | Google Inc. | Methods, systems, and media for presenting comments based on correlation with content |
WO2016088566A1 (ja) | 2014-12-03 | 2016-06-09 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
JP2018525745A (ja) | 2016-02-01 | 2018-09-06 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 情報をプッシュ配信する方法及び装置 |
JP2019161465A (ja) | 2018-03-13 | 2019-09-19 | 株式会社東芝 | 情報処理システム、情報処理方法およびプログラム |
CN111327960A (zh) | 2020-03-05 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 文章处理方法、装置、电子设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2022075668A (ja) | 2022-05-18 |
CN113014988B (zh) | 2024-04-05 |
EP3982276A2 (en) | 2022-04-13 |
EP3982276A3 (en) | 2022-07-06 |
US20220174369A1 (en) | 2022-06-02 |
CN113014988A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7355865B2 (ja) | ビデオ処理方法、装置、デバイスおよび記憶媒体 | |
CN107193792B (zh) | 基于人工智能的生成文章的方法和装置 | |
JP6967059B2 (ja) | 映像を生成するための方法、装置、サーバ、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN109697239B (zh) | 用于生成图文信息的方法 | |
EP3872652B1 (en) | Method and apparatus for processing video, electronic device, medium and product | |
JP7108259B2 (ja) | 情報を生成するための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
CN110234018B (zh) | 多媒体内容描述生成方法、训练方法、装置、设备及介质 | |
CN109582825B (zh) | 用于生成信息的方法和装置 | |
US11704506B2 (en) | Learned evaluation model for grading quality of natural language generation outputs | |
US10915756B2 (en) | Method and apparatus for determining (raw) video materials for news | |
JP2023022845A (ja) | ビデオ処理方法、ビデオサーチ方法及びモデルトレーニング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN110263218B (zh) | 视频描述文本生成方法、装置、设备和介质 | |
JP2023535108A (ja) | ビデオタグ推薦モデルのトレーニング方法及びビデオタグの決定方法、それらの装置、電子機器、記憶媒体及びコンピュータプログラム | |
WO2020052061A1 (zh) | 用于处理信息的方法和装置 | |
JP7030095B2 (ja) | ナレーションを生成するための方法、装置、サーバー、コンピュータ可読記憶媒体及びコンピュータプログラム | |
CN113704507A (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN114782722A (zh) | 图文相似度的确定方法、装置及电子设备 | |
CN113038175B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
CN112307738B (zh) | 用于处理文本的方法和装置 | |
CN114120166A (zh) | 视频问答方法、装置、电子设备及存储介质 | |
CN111259180B (zh) | 图像推送方法、装置、电子设备和存储介质 | |
KR102422844B1 (ko) | 인공지능에 기반하여 영상 컨텐츠의 언어 위기를 관리하는 방법 | |
WO2023016163A1 (zh) | 文字识别模型的训练方法、识别文字的方法和装置 | |
CN115952317A (zh) | 视频处理方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7355865 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |