CN110704681B - 一种生成视频的方法及*** - Google Patents

一种生成视频的方法及*** Download PDF

Info

Publication number
CN110704681B
CN110704681B CN201910916151.4A CN201910916151A CN110704681B CN 110704681 B CN110704681 B CN 110704681B CN 201910916151 A CN201910916151 A CN 201910916151A CN 110704681 B CN110704681 B CN 110704681B
Authority
CN
China
Prior art keywords
video
time sequence
sequence characteristics
information
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910916151.4A
Other languages
English (en)
Other versions
CN110704681A (zh
Inventor
范建康
王标
刘春华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics China R&D Center
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics China R&D Center, Samsung Electronics Co Ltd filed Critical Samsung Electronics China R&D Center
Priority to CN201910916151.4A priority Critical patent/CN110704681B/zh
Publication of CN110704681A publication Critical patent/CN110704681A/zh
Priority to US17/018,464 priority patent/US11881023B2/en
Priority to PCT/KR2020/012391 priority patent/WO2021060757A1/en
Application granted granted Critical
Publication of CN110704681B publication Critical patent/CN110704681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种生成视频的方法及***,本发明实施例的服务器端根据原始视频具有的时序特征对原始视频进行语义分析,对原始视频进行分片,得到具有语义信息的视频分片片段;根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组后,得到用户端的目标视频。这样,本发明实施例就可以根据用户意愿自动生成视频。

Description

一种生成视频的方法及***
技术领域
本发明涉及计算机技术领域,特别涉及一种生成视频的方法及***。
背景技术
目前,当获取到原始视频后,都会对原始视频进行处理,提取视频信息,生成自己感兴趣视频。在对原始视频进行处理时,可以提取视频标签或去除视频冗余部分,得到自己感兴趣的视频片段。
但是,采用上述方法对原始视频进行处理,生成视频时,仅仅是采用诸如提取视频标签或去除视频冗余等简单的手段对原始视频进行处理,没有涉及对原始视频进行统一的分片重组的方法,无法根据用户意愿自动生成视频。
发明内容
有鉴于此,本发明实施例提供一种生成视频的方法,该方法能够根据用户意愿自动生成视频。
本发明实施例还提供一种生成视频的***,该***能够根据用户意愿自动生成视频。
本发明实施例是这样实现的:
一种生成视频的方法,包括:
服务器端根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
服务器端根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;
服务器端根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。
所述进行语义分析包括:
通过视频抓取方式、以及语音识别和图像识别方式对原始视频进行语义分析。
在得到用户端的目标视频之前,还包括:
对重组后的视频分片片段进行平滑处理,使得其统一化。
还包括:
所述设置的具有时序特征的视频生成序列模型根据从用户端获取的用户评价信息实时更新。
所述从用户端获取的偏好视频信息包括:
所述用户端为用户终端,在用户终端设置应用,通过应用采用设置的采集设备从用户端获取偏好视频信息。
一种生成视频的***,包括:原始视频接收模块、原始视频分析切片模块、模型生产模块及目标视频生成模块,其中,
原始视频接收模块,用于接收具有时序特征的原始视频;
原始视频分析切片模块,用于根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
模型生成模块,用于设置具有时序特征的视频生成序列模型;
目标视频生成模块,用于根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。
所述装置还包括存储模块,用于对具有语义信息的视频分片片段进行存储。
所述装置还包括视频统一处理模块,用于对重组后的视频分片片段进行平滑处理,使得其统一化。
还包括用户评价模块,用于接收用户评价信息,根据用户评价信息对具有时序特征的视频生成序列模型实时更新。
如上所见,本发明实施例的服务器端根据原始视频具有的时序特征对原始视频进行语义分析,对原始视频进行分片,得到具有语义信息的视频分片片段;根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组后,得到用户端的目标视频。这样,本发明实施例就可以根据用户意愿自动生成视频。
附图说明
图1为本发明实施例提供的生成视频的方法流程图;
图2为本发明实施例提供的服务器端装置示意图;
图3为本发明实施例提供的生成视频的过程示意图;
图4为本发明实施例提供的实施例一实现流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
本发明实施例为了根据用户意愿自动生成视频,针对具有时序特征的原始视频基于人工智能(AI)方法进行视频分片分段重组,结合用户端的当前实际情况及用户想要达到的目标视频,得到最终的目标视频。具体地说,本发明实施例的服务器端根据原始视频具有的时序特征对原始视频进行语义分析,对原始视频进行分片,得到具有语义信息的视频分片片段;根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。这样,本发明实施例就可以根据用户意愿自动生成视频。
这样,本发明实施例就可以根据用户意愿自动生成视频。
图1为本发明实施例提供的生成视频的方法流程图,其具体步骤为:
步骤101、服务器端根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
步骤102、服务器端根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;
步骤103、服务器端根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。
在该方法中,所述进行语义分析包括:通过视频抓取方式、语音及图像识别等人工智能技术对原始视频进行语义分析。
在该方法中,所述用户端为用户终端,可以为智能终端,智能终端作为采集用户多种信息的终端设备,需要安装支持该方法的应用后,通过摄像头或话筒等采集设备,采集用户的偏好视频信息,同时接收服务器端发送的用户端的目标视频进行显示。
在该方法中,在得到用户端的目标视频之前,还包括:
对重组后的视频分片片段进行平滑处理,使得其统一化,且得到的用户端的目标视频更加平滑。
在该方法中,还包括:所述设置的具有时序特征的视频生成序列模型根据从用户端获取的用户评价信息实时更新和完善。
图2为本发明实施例提供的服务器端装置示意图,包括:原始视频接收模块、原始视频分析切片模块、模型生产模块及目标视频生成模块,其中,
原始视频接收模块,用于接收具有时序特征的原始视频;
原始视频分析切片模块,用于根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
模型生成模块,用于设置具有时序特征的视频生成序列模型;
目标视频生成模块,用于根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模块将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。
在该装置中,还包括存储模块,用于对具有语义信息的视频分片片段进行存储。
在该装置中,还包括视频统一处理模块,用于对重组后的视频分片片段进行平滑处理,使得其统一化,且得到的用户端的目标视频更加平滑。
在该装置中,还包括用户评价模块,用于接收用户评价信息,根据用户评价信息对具有时序特征的视频生成序列模型实时更新和完善。
图3为本发明实施例提供的生成视频的过程示意图,结合图3对本发明实施例进行详细说明。
原始视频接收模块获取到具有时序特征的原始视频可以是人工导入,也可以是更智能地从网络中的视频网站根据视频相关标签自动搜索相关视频并下载导入。所述原始视频不需要存储,直接传给原始视频分析分片模块进行分析。
原始视频分析分片模块是该装置中的核心模块,运用视频捕捉方式、语音识别方式及图像识别方式等相关人工智能技术获取到该原始视频对应的文本序列,并对获取的文本序列进行语义分析后,根据语义活动信息对原始视频进行切片、去重及去除语义活动无关的视频分片,得到具有语义信息的视频分片片段。
存储模块存储的是具有语义信息的视频分片片段,该存储模块按照语义活动信息为视频分片片段建立索引,这样便于后续目标视频生成模块能够快速定位不同语义活动信息对应的视频分片片段。
模型生成模块在生成具有时序特征的视频生成序列模型时可以采用两种方法。第一种方法:根据原始视频分析分片模块的分析结果自动生成并存储具有时序特征的视频生成序列模型;具有时序关系的视频分片分段会自动产生一个视频生成序列模型。这样产生的视频生成序列模型具有合理性。第二种方式,预先设置具有时序特征的视频生成序列模型,包括模型的类别(诸如:化妆类别、烧菜类别和理发类别等)、步骤及各个步骤对应的权重等信息,这样,将设置的序列模型按照不同需求活动进行分类处理,这样便于视频生成流程中能够快速准确地定位符合需求的序列模型。
目标视频生成模块是该装置中另一个核心模块。在该模块中,已经预先设置了多个具有时序特征的视频生成序列模型,该模块根据从用户端获取的偏好视频信息,匹配合适的序列模块。找到合适的序列模型后,利用深度学习等相关技术从所述视频分片片段中获取并重组对应的视频分片片段信息,从而生成一条完整的符合要求的候选视屏,并根据匹配度为每种生成的候选视频计算一个权重值,然后依据权重值的大小顺序以列表方式传送到客户端的应用中。
视频统一处理模块对确定的作为用户端的目标视频进行统一化处理。由不同原始视频分片片段重组生成的新视频,由于视频及语音不统一,所以本模块对重组后的视频进行视频及语音进行统一化。主要运用人工智能图像识别技术对重组后的视频进行分析并消除差异化,使多个视频片段间实现平滑的过度;利用语音识别技术将多语音片段先转换为统一的文本格式,最后运用文本到语音转换(TTS,Text To Speech)技术将文本转化为统一的语音。
用户评价模块在采纳某个生成后的目标视频之后,并以此目标视频进行操作活动。用户可以根据最终的结果给该视频进行打分或评价,并将用户评价信息返回到服务器端,实现序列模型的自我深度学习来不断地修正和完善。
举两个具体例子对本发明实施例进行说明。
实施例一,以化妆视频这一具有时序特征的活动事件举例说明。在该实施例中,用户端中的用户界面是基于安卓应用***层框架构建,服务器端通过Java Web架构,图像识别Python库以及讯飞语音识别实现。当然,在实现时也采用的人工智能技术不限于此实施例,且可用于用户任何界面中。
结合图4,对实施例一的具体过程详细说明。
第一步骤,用户端的应用提供用户化妆信息输入界面,本界面可以进行文本选择(化妆类型)、语音或图片(化妆品、化妆工具、或/和人脸轮廓及肤色)等信息输入。当用户按下确定按钮后,将用户输入信息通过网络传输到服务器端,也就是传输用户的偏好视频信息;
第二步骤,根据用户提交的化妆信息进行图像、语音或文本等分析识别,获得化妆类型、化妆品及化妆工具等信息,根据用户端输入的信息匹配***中的化妆活动类别中的化妆序列模型,匹配成功后执行下一步骤;
第三步骤,匹配到合适的时序模型后,根据该时序模型在视频切片片段中搜索对应的视频切片片段并重组,则生成化妆视频;
第四步骤,如果重组视频失败,就会切换化妆视频的时序模型,重新进行视频重组,如果重组视频成功就继续执行下一步骤;
第五步骤,在视频统一处理阶段,主要运用人工智能图像识别技术对重组后的视频进行分析并消除差异化,使多个视频片段实现平滑的过渡;并利用语音识别技术将多语音片段先转化为统一的文本格式,最后运用TTS技术将文本转化为统一的语音;
第六步骤,将生成的化妆视频推送给用户端后,用户端通过浏览结果判断是否该视频符合自己的需求。如果不符合,可以提醒用户输入其他的必要相关信息,然后再转入第一步骤继续执行。如果符合要求,则用户可以按照该化妆视频完成化妆操作;
第七步骤,用户根据最终的化妆效果,给该化妆视频进行评价并提交评价结果。
实施例二,以烘焙松软蛋糕视频这一具有时序特征的活动事件举例说明。该实施例的具体过程如下所述。
第一步骤,用户打开该***在移动终端设备,如手机或平板电脑等中的应用,将当前的烘焙工具和烘焙材料及其他相关信息输入到应用中,应用获取到烘焙材料:低筋面粉、酵母、奶粉、色拉油、花生油、细砂糖、精盐和鸡蛋;烘焙工具:烤箱、筷子、打蛋器、碗、模具、量杯及矿泉水;
第二步骤,烘焙松软面包流程:
首先,蛋黄和蛋白分离,一般视频中会通过分蛋器进行分离,但是当前用户没有分蛋器,则服务器端***中有替代分蛋器的视频片段,比如用蛋壳分离或用矿泉水瓶分离蛋白蛋黄,选择此视频切片片段作为蛋黄蛋白分离的参考视频;
其次,蛋黄和蛋白搅拌,由于用户当前有打蛋器,则选择有打蛋器搅拌的视频切片片段;
再次,加入其它材料搅拌,一般视频中有做蛋糕都需要加入黄油,但是当前用户没有黄油而是有花生油,则***就会选择用花生油替代黄油进行搅拌的视频切片片段;
最后,倒入模具烘烤,这个直接选取采用烤箱烘烤的视频切片片段。
第三步骤,经过第二步骤的过程,将使用到的视频切片片段按照时序关系进行重组,重组后的视频在统一处理后生成一个连贯的带有语音的新视频,这样,用户可以在现有材料和工具的基础上,完整地通过用户端完整地体验烘焙松软蛋糕的过程。
可以看出,本发明实施例针对的是具有时序特征的视频自动生成方案,可以允许用户在现有操作环境的基础上,获取得到一个符合当前操作环境的具有时序特征的重组的目标视频。这样,用户完全可以参考这个目标视频利用现在的操作环境完整地完成某个活动。***还可以根据用户的反馈信息不断地修正在服务器端设置的序列模型,以便能够更加生成贴合度更高的目标视频。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (9)

1.一种生成视频的方法,其特征在于,包括:
服务器端根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
服务器端根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型,所述设置的具有时序特征的视频生成序列模型,包括模型的类别、步骤及各个步骤对应的权重信息;在所述匹配时,根据所述设置的具有时序特征的视频生成序列模型包括的信息,将所述具有语义信息的视频分片片段定位到对应的符合所述信息的具有时序特征的视频生成序列模型中;
服务器端根据匹配得到的对应的具有时序特征的视频生成序列模型将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频。
2.如权利要求1所述的方法,其特征在于,所述进行语义分析包括:
通过视频抓取方式、以及语音识别和图像识别方式对原始视频进行语义分析。
3.如权利要求1所述的方法,其特征在于,在得到用户端的目标视频之前,还包括:
对重组后的视频分片片段进行平滑处理,使得其统一化。
4.如权利要求1所述的方法,其特征在于,还包括:
所述设置的具有时序特征的视频生成序列模型根据从用户端获取的用户评价信息实时更新。
5.如权利要求1所述的方法,其特征在于,所述从用户端获取的偏好视频信息包括:
所述用户端为用户终端,在用户终端设置应用,通过应用采用设置的采集设备从用户端获取偏好视频信息。
6.一种生成视频的***,其特征在于,包括:原始视频接收模块、原始视频分析切片模块、模型生产模块及目标视频生成模块,其中,
原始视频接收模块,用于接收具有时序特征的原始视频;
原始视频分析切片模块,用于根据获取的原始视频具有的时序特征对所述原始视频进行语义分析,对原始视频分片,得到具有语义信息的视频分片片段;
模型生成模块,用于设置具有时序特征的视频生成序列模型;
目标视频生成模块,用于根据从用户端获取的偏好视频信息从设置的具有时序特征的视频生成序列模型中,匹配得到对应的具有时序特征的视频生成序列模型;根据匹配得到的对应的具有时序特征的视频生成序列模型将得到具有语义信息的视频分片片段进行重组,得到用户端的目标视频;
其中,所述设置的具有时序特征的视频生成序列模型,包括模型的类别、步骤及各个步骤对应的权重信息;在所述匹配时,根据所述设置的具有时序特征的视频生成序列模型包括的信息,将所述具有语义信息的视频分片片段定位到对应的符合所述信息的具有时序特征的视频生成序列模型中。
7.如权利要求6所述的***,其特征在于,所述***还包括存储模块,用于对具有语义信息的视频分片片段进行存储。
8.如权利要求6或7所述的***,其特征在于,所述***还包括视频统一处理模块,用于对重组后的视频分片片段进行平滑处理,使得其统一化。
9.如权利要求6或7所述的***,其特征在于,还包括用户评价模块,用于接收用户评价信息,根据用户评价信息对具有时序特征的视频生成序列模型实时更新。
CN201910916151.4A 2019-09-26 2019-09-26 一种生成视频的方法及*** Active CN110704681B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910916151.4A CN110704681B (zh) 2019-09-26 2019-09-26 一种生成视频的方法及***
US17/018,464 US11881023B2 (en) 2019-09-26 2020-09-11 Method and system for generating video
PCT/KR2020/012391 WO2021060757A1 (en) 2019-09-26 2020-09-14 Method and system for generating video

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910916151.4A CN110704681B (zh) 2019-09-26 2019-09-26 一种生成视频的方法及***

Publications (2)

Publication Number Publication Date
CN110704681A CN110704681A (zh) 2020-01-17
CN110704681B true CN110704681B (zh) 2023-03-24

Family

ID=69196426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910916151.4A Active CN110704681B (zh) 2019-09-26 2019-09-26 一种生成视频的方法及***

Country Status (3)

Country Link
US (1) US11881023B2 (zh)
CN (1) CN110704681B (zh)
WO (1) WO2021060757A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111246315B (zh) * 2020-01-21 2022-06-03 咪咕视讯科技有限公司 视频交互方法、***、边缘节点、客户端及存储介质
CN111918146B (zh) * 2020-07-28 2021-06-01 广州筷子信息科技有限公司 一种视频合成方法和***
CN113204992B (zh) * 2021-03-26 2023-10-27 北京达佳互联信息技术有限公司 视频质量确定方法、装置、存储介质及电子设备
US20230081916A1 (en) * 2021-09-14 2023-03-16 Black Sesame Technologies Inc. Intelligent video enhancement system

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870578B2 (en) 2000-04-07 2011-01-11 Visible World, Inc. Systems and methods for managing and distributing media content
US7870577B2 (en) 2000-04-07 2011-01-11 Visible World, Inc. Systems and methods for semantic editorial control and video/audio editing
WO2006133364A2 (en) 2005-06-08 2006-12-14 Visible World Systems and methods for semantic editorial control and video/audio editing
US8566315B1 (en) * 2009-03-09 2013-10-22 Google Inc. Sequenced video segment mix
JP5392780B2 (ja) 2010-02-23 2014-01-22 独立行政法人産業技術総合研究所 コンテンツ構造化処理方法、コンテンツ構造化処理装置及びコンテンツ構造化処理プログラム
US9554111B2 (en) * 2010-03-08 2017-01-24 Magisto Ltd. System and method for semi-automatic video editing
US9342599B2 (en) * 2011-05-25 2016-05-17 Thomas Stetson Elliott Methods and systems for centralized audio and video news product collection, optimization, storage, and distribution
US9304648B2 (en) * 2013-06-26 2016-04-05 Google Inc. Video segments for a video related to a task
KR102115066B1 (ko) 2013-07-23 2020-06-05 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 안정화를 위한 적응적 경로 평활화
US9928878B2 (en) * 2014-08-13 2018-03-27 Intel Corporation Techniques and apparatus for editing video
CN107077595A (zh) * 2014-09-08 2017-08-18 谷歌公司 选择和呈现代表性帧以用于视频预览
US9607224B2 (en) 2015-05-14 2017-03-28 Google Inc. Entity based temporal segmentation of video streams
KR20170095039A (ko) 2016-02-12 2017-08-22 한국전자통신연구원 샷 분할을 위한 콘텐츠 편집장치 및 그 방법
CN106686385B (zh) 2016-12-30 2018-09-25 平安科技(深圳)有限公司 视频压缩感知重构方法及装置
KR102202372B1 (ko) 2017-01-17 2021-01-13 한국전자통신연구원 영상 컨텐츠를 재사용하여 사용자 인터랙션을 인지할 수 있는 인터랙티브 미디어 제작 시스템 및 그 운용방법
CN106952269B (zh) * 2017-02-24 2019-09-20 北京航空航天大学 近邻可逆的视频前景物体序列检测分割方法及***
CN108509465B (zh) * 2017-02-28 2022-03-15 阿里巴巴集团控股有限公司 一种视频数据的推荐方法、装置和服务器
US10536580B2 (en) * 2017-06-01 2020-01-14 Adobe Inc. Recommendations based on feature usage in applications
CN110121116A (zh) * 2018-02-06 2019-08-13 上海全土豆文化传播有限公司 视频生成方法及装置
US10885942B2 (en) * 2018-09-18 2021-01-05 At&T Intellectual Property I, L.P. Video-log production system

Also Published As

Publication number Publication date
CN110704681A (zh) 2020-01-17
US20210097288A1 (en) 2021-04-01
WO2021060757A1 (en) 2021-04-01
US11881023B2 (en) 2024-01-23

Similar Documents

Publication Publication Date Title
CN110704681B (zh) 一种生成视频的方法及***
US11538208B2 (en) Picture generation method and device, storage medium, and electronic device
CN110519636B (zh) 语音信息播放方法、装置、计算机设备及存储介质
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN108304154B (zh) 一种信息处理方法、装置、服务器及存储介质
CN110472008B (zh) 智能交互方法以及装置
CN112738557A (zh) 视频处理方法及装置
CN112349283B (zh) 一种基于用户意图的家电控制方法及智能家电
CN110516749A (zh) 模型训练方法、视频处理方法、装置、介质和计算设备
KR20190046062A (ko) 대화 시스템을 위한 대화 시나리오 데이터베이스 구축 방법 및 장치
KR102117287B1 (ko) 대화 시스템을 위한 대화 시나리오 데이터베이스 구축 방법 및 장치
CN111063455A (zh) 远程医疗的人机交互方法和装置
CN106356056B (zh) 语音识别方法和装置
CN110297899A (zh) 在智能家居操作***中发送推荐信息的方法及装置
CN114528474A (zh) 推荐对象确定方法、装置、电子设备及存储介质
CN116756576B (zh) 数据处理方法、模型训练方法、电子设备及存储介质
CN111444383B (zh) 一种音频数据处理方法、装置以及计算机可读存储介质
CN112949456A (zh) 视频特征提取模型训练、视频特征提取方法和装置
CN116052646B (zh) 语音识别方法、装置、存储介质和计算机设备
CN111695360A (zh) 语义分析方法、装置、电子设备及存储介质
CN112182460A (zh) 资源的推送方法和装置、存储介质及电子装置
CN112862073B (zh) 一种压缩数据分析方法、装置、存储介质及终端
CN113099305A (zh) 播放控制方法及装置
CN110400629B (zh) 一种超声设备及其扫查参数组合获取方法、装置和***
CN110163043B (zh) 面部检测方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant